Apache Cassandra - Rozproszony system bazodanowyCQL...

Apache CassandraRozproszony system bazodanowy

Bartosz Szreder

Bartosz Szreder Apache Cassandra 1 / 10

Co to jest?

Rozproszona baza danych napisana w Java (gossip-based distributed system).NoSQL (CQL – Cassandra Query Language).Open-source na licencji Apache 2.0.Pierwotna wersja opracowana w Facebooku na potrzeby przeszukiwaniaskrzynek odbiorczych.

Co to jest?

Rozproszona baza danych napisana w Java (gossip-based distributed system).

NoSQL (CQL – Cassandra Query Language).Open-source na licencji Apache 2.0.Pierwotna wersja opracowana w Facebooku na potrzeby przeszukiwaniaskrzynek odbiorczych.

Co to jest?

Rozproszona baza danych napisana w Java (gossip-based distributed system).NoSQL (CQL – Cassandra Query Language).

Open-source na licencji Apache 2.0.Pierwotna wersja opracowana w Facebooku na potrzeby przeszukiwaniaskrzynek odbiorczych.

Co to jest?

Rozproszona baza danych napisana w Java (gossip-based distributed system).NoSQL (CQL – Cassandra Query Language).Open-source na licencji Apache 2.0.

Pierwotna wersja opracowana w Facebooku na potrzeby przeszukiwaniaskrzynek odbiorczych.

Co to jest?

Rozproszona baza danych napisana w Java (gossip-based distributed system).NoSQL (CQL – Cassandra Query Language).Open-source na licencji Apache 2.0.Pierwotna wersja opracowana w Facebooku na potrzeby przeszukiwaniaskrzynek odbiorczych.

Czym się chwalą?

Wysoka wydajność (cokolwiek to znaczy).

Liniowa skalowalność.Decentralizacja.Odporność na awarie.

Czym się chwalą?

Wysoka wydajność (cokolwiek to znaczy).Liniowa skalowalność.

Decentralizacja.Odporność na awarie.

Czym się chwalą?

Wysoka wydajność (cokolwiek to znaczy).Liniowa skalowalność.Decentralizacja.

Odporność na awarie.

Czym się chwalą?

Wysoka wydajność (cokolwiek to znaczy).Liniowa skalowalność.Decentralizacja.Odporność na awarie.

Decentralizacja i odporność

Nie ma SPOF. Nie ma żadnej „głównej” repliki.

Awarie węzłów nie zaburzają działania aplikacji.Można dostawiać węzły w locie.Przezroczystość z punktu widzenia aplikacji.

Nie ma SPOF. Nie ma żadnej „głównej” repliki.Awarie węzłów nie zaburzają działania aplikacji.

Można dostawiać węzły w locie.Przezroczystość z punktu widzenia aplikacji.

Nie ma SPOF. Nie ma żadnej „głównej” repliki.Awarie węzłów nie zaburzają działania aplikacji.Można dostawiać węzły w locie.

Przezroczystość z punktu widzenia aplikacji.

Nie ma SPOF. Nie ma żadnej „głównej” repliki.Awarie węzłów nie zaburzają działania aplikacji.Można dostawiać węzły w locie.Przezroczystość z punktu widzenia aplikacji.

Model danych

Wiersze indeksowane kluczem, tabele podzielone na tablety o ciągłychprzedziałach kluczy.

Odczyty z i zapisy do jednego wiersza są atomowe (niezależnie od liczbykolumn).Kolumny są grupowane w tzw. rodziny kolumn, w których ustalamy klucze(de facto indeksy).Wsparcie dla transakcji na poziomie pojedynczego wiersza.. . . ale nie dla „ogólnych” transakcji na zbiorze wierszy (jeszcze? nadal?).

Model danych

Wiersze indeksowane kluczem, tabele podzielone na tablety o ciągłychprzedziałach kluczy.Odczyty z i zapisy do jednego wiersza są atomowe (niezależnie od liczbykolumn).

Kolumny są grupowane w tzw. rodziny kolumn, w których ustalamy klucze(de facto indeksy).Wsparcie dla transakcji na poziomie pojedynczego wiersza.. . . ale nie dla „ogólnych” transakcji na zbiorze wierszy (jeszcze? nadal?).

Model danych

Wiersze indeksowane kluczem, tabele podzielone na tablety o ciągłychprzedziałach kluczy.Odczyty z i zapisy do jednego wiersza są atomowe (niezależnie od liczbykolumn).Kolumny są grupowane w tzw. rodziny kolumn, w których ustalamy klucze(de facto indeksy).

Wsparcie dla transakcji na poziomie pojedynczego wiersza.. . . ale nie dla „ogólnych” transakcji na zbiorze wierszy (jeszcze? nadal?).

Model danych

Wiersze indeksowane kluczem, tabele podzielone na tablety o ciągłychprzedziałach kluczy.Odczyty z i zapisy do jednego wiersza są atomowe (niezależnie od liczbykolumn).Kolumny są grupowane w tzw. rodziny kolumn, w których ustalamy klucze(de facto indeksy).Wsparcie dla transakcji na poziomie pojedynczego wiersza.

. . . ale nie dla „ogólnych” transakcji na zbiorze wierszy (jeszcze? nadal?).

Model danych

Wiersze indeksowane kluczem, tabele podzielone na tablety o ciągłychprzedziałach kluczy.Odczyty z i zapisy do jednego wiersza są atomowe (niezależnie od liczbykolumn).Kolumny są grupowane w tzw. rodziny kolumn, w których ustalamy klucze(de facto indeksy).Wsparcie dla transakcji na poziomie pojedynczego wiersza.. . . ale nie dla „ogólnych” transakcji na zbiorze wierszy (jeszcze? nadal?).

Jak działają zapisy?

Zapisy idą najpierw do CommitLog.

CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).

Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.

Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.

Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.

W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.

Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Zapisy idą najpierw do CommitLog.CommitLog zapisywany co pewien czas (zależnie od konfigu).Potem zapisy trafiają do Memtable.Memtable to cache wierszy indeksowanych kluczem. Jak się zapcha, robimyflush.Flush powoduje sortowanie wierszy w Memtable po kluczu i sekwencyjnyzapis.W wyniku flusha powstaje niemutowalna struktura SSTable.Odczyt potencjalnie zbiera kawałki danych z wielu SSTable na dysku iMemtable w RAM.

Dokąd trafiają poszczególne dane?

Klucz wiersza.Współczynnik replikacji (ile węzłów ma replikować dany wiersz).Strategia replikacji (które węzły mają replikować dany wiersz).

Strategia może być prosta (kolejne węzły w pierścieniu) albo uwzględniającafizyczną topologię sieci (podział na szafy, fizyczne położenie na świecie itd.).

Cassandra nie zmienia zbioru węzłów dla danego wiersza w oparciu o zmienneparametry, w rodzaju bieżącego obciążenia, dostępności węzłów czy tego,z którymi węzłami rozmawia klient.

Odśmiecanie i scalanie struktur

Co N operacji flush zbierz N SSTable o podobnym rozmiarze i mergujsekwencyjnie.

Po scaleniu usuń stare SSTables.W starszych wersjach Cassandra tylko scalanie mogło usuwać „nagrobki”.

Co N operacji flush zbierz N SSTable o podobnym rozmiarze i mergujsekwencyjnie.Po scaleniu usuń stare SSTables.

W starszych wersjach Cassandra tylko scalanie mogło usuwać „nagrobki”.

Co N operacji flush zbierz N SSTable o podobnym rozmiarze i mergujsekwencyjnie.Po scaleniu usuń stare SSTables.W starszych wersjach Cassandra tylko scalanie mogło usuwać „nagrobki”.

Cassandra does not support joins or subqueries, except for batch analysis throughHadoop. Rather, Cassandra emphasizes denormalization through features likecollections.

At one level, Cassandra tables, rows, and columns can be thought of much thesame way as those in a relational database. In both SQL and CQL you definetables, which have defined columns and associated data types, and you can createindexes to allow efficient querying by column values.

However, an important difference is that since Cassandra is designed from theground up as a distributed system, it emphasizes denormalization instead ofnormalization and joins, and provides tools like collections to support this.

Ograniczenia

Brak joinów i podzapytań (o tym było).

Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.Klucze wierszy nie mogą przekraczać 64 KiB.Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.Collection values may not be larger than 64KB.

Ograniczenia

Brak joinów i podzapytań (o tym było).Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.

Klucze wierszy nie mogą przekraczać 64 KiB.Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.Collection values may not be larger than 64KB.

Ograniczenia

Brak joinów i podzapytań (o tym było).Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.Klucze wierszy nie mogą przekraczać 64 KiB.

Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.Collection values may not be larger than 64KB.

Ograniczenia

Brak joinów i podzapytań (o tym było).Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.Klucze wierszy nie mogą przekraczać 64 KiB.Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.

A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.Collection values may not be larger than 64KB.

Ograniczenia

Brak joinów i podzapytań (o tym było).Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.Klucze wierszy nie mogą przekraczać 64 KiB.Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.

Collection values may not be larger than 64KB.

Ograniczenia

Brak joinów i podzapytań (o tym było).Wszystkie dane w pojedynczym tablecie muszą zmieścić się na pojedynczejmaszynie w klastrze.Klucze wierszy nie mogą przekraczać 64 KiB.Maksymalna liczba komórek (wiersze × kolumny) w pojedynczym tablecie to2 miliardy.A single column value may not be larger than 2GB; in practice, „single digitsof MB” is a more reasonable limit, since there is no streaming or randomaccess of blob values.Collection values may not be larger than 64KB.

Apache Cassandra - Rozproszony system bazodanowyCQL...

Documents

Transcript of Apache Cassandra - Rozproszony system bazodanowyCQL...

Wprowadzenie do Apache Spark · 2017-01-20 · Wprowadzenie do Apache Spark Jakub Toczek. Epoka informacyjna. MapReduce. MapReduce. Apache Hadoop narodziny w 2006 roku z Apache Nutch

TECHNICAL TRANSACTIONS CZASOPISMO TECHNICZNE · 2014. 9. 23. · 42 1. Introduction A frequent change of power equipment mode is rather typical of diesel-locomotive operation. According

· clean bandit - rather be coldplay - adventure of a lifetime daft punk - get lucky depeche mode - enjoy the silence dnce - cake by the ocean dnce/rod steward - do ya thing i’m

Miasto Popiołów- Cassandra Clare

Cassandra Clare - Dary anioła. Tom 6. Miasto niebiańskiego ognia.pdf

Tematyka - Amazon S3...•‘To kill two birds with one stone ... extreme pain of a surgical procedure without anesthetic, though evidence for biting a bullet rather than a leather

Realtime BigData Step by Step mit Lambda, Kafka, Storm und Hadoop

Miasto popiołów. Trylogia Dary Anioła tom 2. Cassandra Clare

Template for modules of the revised handbook Imp… · Web viewAs the theme module of this chapter states, two reasons for imputation (rather than other ways of estimation) are

PCT: Point Cloud Transformer · Unlike the above methods, our PCT is based on Trans-former rather than using self-attention as an auxiliary mod-ule. While a framework by Wang et al.

Kamil Chmielewski, Jacek Juraszek - "Hadoop. W poszukiwaniu złotego młotka."

intra-mart Accel Platformaccel-archives.intra-mart.jp/2014-summer/document/iap/... · 2015-02-13 · 2013-07-01 第4版 下記を追加・変更しました 「Cassandra への接続認証設定」の追加

Miasto Kości- Cassandra Clare

Big datahome.agh.edu.pl/~wojnicki/wiki/_media/pl:ztb:ztb-hadoop.pdf · 2013-11-08 · Hadoop Sector MapReduce MapReduce Sphere UDF BigTable HBase/Hive Space GFS HDFS SDFS — —

Paweł Kucharski: Oswajamy Słonia czyli po co nam Hadoop

JOHN C. MAXWELL JIM DORNAN - Ideas Profesionales · 2016-06-06 · john grisham george gallup robert e. lee dennis rodman james dobson dan rather madonna hideo nomo jerry y patty

FPSS WS1415 Part1 V08 20141112 - TU Dresdenst.inf.tu-dresden.de/.../FPSS_WS1415_Part1_V08_20141112.pdf · 2014. 11. 12. · Dr. Fran k J. Furrer - WS 2014/15 2 I prefer dialog - rather

HADOOP Dariusz Żbik - data.proidea.org.pldata.proidea.org.pl/jdd/2edycja/materialy/prezentacje/Dariusz_Zbik.pdf · HADOOP Copyright 2007 © Software Mind Sp. z o. o. KOSZYK – Hadoop

Hurtownie Danych i Business Intelligence: przegląd …...periodical loading into Hadoop aggregating log entries (for offline analysis) Big Data Architecture R.Wrembel - Politechnika

SEIJI OZAWA MARTHA ARGERICH · 2020. 5. 21. · Grieg’s own title for his Holberg Suite was Fra Holbergs Tid (“From Holberg’s Time”) – an indication that rather than attempt

intra-mart Accel Platformaccel-archives.intra-mart.jp/2014-summer/document/iap/... · 2015-02-13 · 2013-07-01 第4版下記を追加・変更しました「Cassandra への接続認証設定」の追加