Programmēšana

Labākās grafu datu bāzes

Grafiku datu bāzes, kas skaidri pauž savienojumus starp mezgliem, ir efektīvāk analizēt tīklus (datoru, cilvēku, ģeogrāfiskos vai citādi) nekā relāciju datu bāzes. Tas ļauj diagrammu datu bāzēm sagatavoties tādām lietojumprogrammām kā krāpšanas atklāšanas un ieteikumu sistēmas.

Viena no galvenajām grafu datubāzu izlozēm ir spēja palaist grafu skaitļošanas algoritmus. Tie tiek izmantoti uzdevumiem, kas nav piemēroti relāciju datu bāzēm, piemēram, diagrammu meklēšana, ceļa meklēšana, centralizācija, PageRank un kopienas noteikšana. Grafu algoritmi galvenokārt tiek atbalstīti analītisko (OLAP un HTAP) grafu datu bāzēs, lai gan dažas transakciju (OLTP) grafu datu bāzes, piemēram, Neo4j, tos atbalsta.

Visām šeit apskatītajām diagrammu datu bāzēm ir laba horizontālā mērogojamība. Daži atbalsta arī lasāmās kopijas, globālo izplatīšanu un automātisko horizontālo dalīšanu.

Amazones Neptūns

Amazon Neptune ir pilnībā pārvaldīts darījumu (OLTP) grafu datu bāzes pakalpojums ar ACID īpašībām un tūlītēju konsekvenci, kura pamatā ir mērķa vajadzībām veidots augstas veiktspējas grafu datu bāzes dzinējs, kas ir optimizēts miljardu attiecību glabāšanai un grafika vaicāšanai ar milisekundēm latentums. Neptūns atbalsta divas populārākās atvērtā pirmkoda grafu vaicājumu valodas - Apache TinkerPop Gremlin un W3C SPARQL.

Neptūna datu bāzes kopām var būt līdz pat 64 TB automātiskās mērogošanas krātuve sešās jūsu datu kopijās trīs pieejamības zonās un vairāk, ja iespējojat augstu pieejamību, izmantojot lasīšanas kopijas papildu zonās. Neptūns automātiski atklāj datu bāzes avārijas un tiek restartēts - parasti 30 sekunžu laikā vai mazāk - bez avārijas atkopšanas vai datu bāzes kešatmiņas atjaunošanas, jo kešatmiņa ir izolēta no datu bāzes procesiem un var izdzīvot restartējot. Ja neizdodas visa primārā instance, Neptūns automātiski neizdosies vienā no līdz 15 lasītām kopijām. Dublējumi tiek nepārtraukti straumēti uz Amazon S3.

Jūs varat mērogot Neptūna kopas uz augšu un uz leju, modificējot gadījumus, vai, lai izvairītos no dīkstāves, pievienojot vēlamā lieluma instanci un izslēdzot veco instanci, tiklīdz datu kopija ir migrējusi un jūs esat paaugstinājis jauno instanci par galveno. Neptūna VM instances izmēri svārstās no db.r4.large (divi vCPU un 16 GiB RAM) līdz db.r4.8xlarge (32 vCPU un 244 GiB RAM), piešķirot Neptūnam 16x dinamisko diapazonu rakstīšanai un 256x dinamisko diapazonu lasa (skaitot izlasītās kopijas).

Izlasiet manu pārskatu par Amazon Neptune.

AnzoGraph

AnzoGraph ir masveidā paralēla atmiņā ievietota OLAP grafiku datu bāze, kas darbojas ar uzņēmuma datu avotiem un veic paralēlas RDF un CSV formātu datu ielādes. AnzoGraph var izvietot viena mezgla smilšu kastēs vai kopās ar tik daudz mezglu, cik nepieciešams ražošanai. AnzoGraph ir ACID darījumu īpašības.

AnzoGraph izmanto W3C standarta RDF triple un quad datus un SPARQL 1.1 vaicājumus. Tas atbalsta iezīmētos rekvizītu grafikus kā daļu no RDF krātuves, kas atbilst ierosinātajiem RDF * un SPARQL * standartiem, un tam ir paplašinājumi SPARQL, lai atbalstītu grafu algoritmus, secinājumus, logu apkopojumus, BI funkcijas un nosauktos skatus. Tiek plānots atbalsts ar Neo4j saderīgai OpenCypher valodai un Neo4j protokola Bolt atbalstam.

AnzoGraph piedāvā augstas veiktspējas grafiku vaicājumu izpildi un mērogojamību līdz miljardiem un pat triljoniem trīskāršu, kā arī ātras paralēlas datu slodzes, kurām nav nepieciešams datubāzi bezsaistē. AnzoGraph kopas var izvietot CentOS, Kubernetes un AWS. Google Cloud Platform un AnzoGraph Azure izvietojumus parasti uzskata par Kubernetes izvietojumiem. AnzoGraph ir parādījis mērogojamību līdz 40 mezgliem sintētiskajā etalonā.

Izlasiet manu pārskatu par AnzoGraph.

Neo4j

Neo4j ir mērogojama OLTP grafu datu bāze ar dažām OLAP iespējām. Neo4j bija sākotnējā grafu datu bāze, kas pirmo reizi tika izveidota 1999. gadā, un joprojām ir tirgus līderis.

Kaut arī atvērtā koda Neo4j kopienas izdevums ir ierobežots ar vienu serveri, Neo4j Enterprise izdevums ļauj kopai pievienot tik daudz mezglu, cik nepieciešams veiktspējas nolūkos.

Katrs Neo4j mezgls augsta pieejamība klasteris satur datu bāzi un klastera pārvaldības komponentu, un klasterim var piekļūt, izmantojot slodzes līdzsvarotāju. Pilns grafiks tiek atkārtots katram klastera gadījumam, un katra HA klastera lasīšanas spēja lineāri palielinās līdz ar servera gadījumu skaitu. Neo4j var veikt desmitiem tūkstošu rakstu sekundē, vienlaikus saglabājot pilnībā ACID darījumus.

Neo4j cēloņsakarība kopa, lasīšanas un rakstīšanas serveru kodols tiek apvienots ar vienu vai vairākām asinhroni atjauninātām lasāmo kopiju kopām. Jebkurai lietojumprogrammai ir garantēta cēloņsakarība, kas nozīmē, ka tā garantē vismaz savu rakstu lasīšanu, pat ja aparatūra un tīkli neizdodas. Cēloņsakarības kopas nolasītās kopijas var tikt ģeogrāfiski sadalītas, lai uzlabotu vaicājumu veiktspēju lietotājiem repliku tuvumā.

Izlasiet manu pārskatu par Neo4j.

TigerGraph

TigerGraph ir reāllaika vietējā paralēlā HTAP diagrammu datu bāze, kas pieejama izvietošanai mākonī vai lokāli. TigerGraph atbalsta ACID rekvizītus, tai ir iebūvēta datu saspiešana, tā automātiski sadala diagrammu klastera ietvaros un apgalvo, ka tā ir ātrāka par konkurentu. Tas izmanto ziņojumu nodošanas arhitektūru, kas pēc savas būtības ir paralēla tādā veidā, kas mērogojas atbilstoši datu lielumam.

TigerGraph tika izstrādāts, lai varētu veikt dziļo saišu analīzi, kā arī reāllaika tiešsaistes darījumu apstrādi un liela apjoma datu ielādi. Ar “dziļo saišu analīzi” TigerGraph nozīmē sekot attiecībām no virsotnes līdz diagrammai trīs vai vairākiem apiņiem un analizēt rezultātus.

Lai gan plaši tiek izmantotas vairākas atvērtā pirmkoda grafu vaicājumu valodas, piemēram, Cypher, Gremlin un SPARQL, TigerGraph ir jauna vaicājumu valoda GSQL. GSQL apvieno SQL līdzīgu vaicājumu sintaksi ar Cypher līdzīgu grafu navigāciju, kā arī procesuālo programmēšanu un lietotāja definētās funkcijas. TigerGraph var pārveidot Cypher par GSQL cilvēkiem, kas pārvietojas no Neo4j datu bāzes.

TigerGraph piedāvā pārvaldītu mākoņu piedāvājumu, kas pašlaik ir ierobežotā priekšskatījumā. TigerGraph ir parādījis 6,7 reizes lielāku ātrumu, palaižot lasīšanas un rakstīšanas kopu ar astoņām mašīnām, taču neko nav teicis par lasāmām kopijām vai ģeogrāfisko sadalījumu.

Izlasiet manu TigerGraph pārskatu.

$config[zx-auto] not found$config[zx-overlay] not found