台灣官方代理 Neo4j 一站式專業服務
即刻諮詢

什麼是 Neo4j?

Neo4j 介紹

Neo4j 是由 Neo4j, Inc. 開發的 NoSQL 非關聯性圖形資料庫管理系統。2000 年 Neo4j 的創始人遇到了 RDBMS 的性能問題,因此開始建構第一個 Neo4j 原型,自 2003 年開始研發, 2007 年正式發佈第一版。2020 年被 Forrester Wave™ 評為圖形數據平台領導者,Neo4j 的專業技術與不斷創新,目前已成為全球頂尖企業及組織最值得信賴的智能應用服務。

Neo4j 創造驚人價值

大數據時代,在面對龐大且複雜的數據資料,傳統 MySQL 資料庫需要耗費大量時間、處理分析數據之間的關係。 Neo4j 開發的原生圖形資料庫 (Native Graph Database) ,實現了專業資料庫等級的圖形化資料模型儲存,在面對錯綜複雜的資料關係,可以達到靈活存取、快速查詢、優化運用的功能,包含 ACID 交易的支援、叢集支援、備份與容錯移轉…等,適合企業級生產環境下的各種應用。

Why Neo4j?

到 2022 年,圖資料庫的應用將以每年 100% 的速度增長,以不斷加速數據準備,從而實現更複雜和適應性更強的數據科學
- Gartner Prediction

什麼是圖形資料庫?

圖形資料庫 (Graph database) 是一種非關聯型資料庫,是以圖數據結構的形式來存儲和查詢數據的資料庫。 相較於傳統的 SQL 資料庫,圖形資料庫使用節點、邊和屬性來表示和儲存資料,更擅長快速處理、查詢龐大複雜的資料關係,無須靠外鍵推導或外部系統來處理數據,解決傳統關聯式資料庫的局限性。 不僅是 Neo4j,Amazon、Microsoft、Oracle、SAP 和其他公司都推出了圖形資料庫 (或至少具有圖形功能),顯示圖形資料時代已經正式到來。
圖資料庫:分析資料間關係的最佳技術
圖資料庫是近年來成長最快速的資料庫技術

為什麼您要選擇 Neo4j?

  • Neo4j 連續蟬聯 DB-Engines ranking No.1.
  • Forrester Wave™ 評為圖形數據平台領導者
  • 全球 100 大企業都採用 Neo4j 解決方案
  • 處理大量複雜數據比傳統關聯式資料庫快上 1000 倍甚至 10000 倍
  • 閃電般讀寫速度,幾秒鐘內探索數十億個數據點並識別
  • Neo4j 由 220,000 名開發人員、數據科學家和架構師組成,致力於解決世界上最複雜和最有價值的數據問題
  • Neo4j 是唯一結合了原生圖形存儲、高安全、可擴展的速度優化架構、ACID 合規的企業級圖形數據庫,以確保查詢關係的可預測性與完整性,也是百家財富 500 強公司、政府機構和非政府組織部署它的原因

Neo4j 的優點與特色

Neo4j 的優異表現,在使用者、開發人員和 DBA 中都受歡迎
即時交易與分析型資料處理
業務運行的交易型數據 (OLTP)、分析型應用的數據負載、ACID 交易支援
高性能
Neo4j 可部署在一個可容錯、可擴充的叢集上 (多備份主從複製的方式)、具有熱備份和效能監控功能
高效硬體使用率
少了大量索引關係,也大幅度減少了硬體計算的需求,可以讓 CPU 用更少的資源完成查詢的工作
介面人性化
提供查詢與展示一體化的 Web 操作介面
關係的發現與可視化
交互型的圖、網絡數據操作,將數據以視覺化的圖形呈現,更容易發現在瀏覽獨立數據表時所無法察覺的關聯
易於開發、測試和部署
使用的宣告式圖查詢語言 Cypher,是以 jvm 為基礎,並且可以讓使用者自訂查詢方式 (如自訂預存程序),查詢效率高

Neo4j 原生圖形資料庫 VS 其他類型資料庫

效能 Neo4j 關聯式資料庫 其他 NoSQL 資料庫
資料模型 Neo4j 提供靈活的資料模型,邏輯模型和物理模型之間不會相互耦合。可以隨時、隨意增加或更改資料和資料類型,大幅縮短開發、反覆運算時間 必須與建模者一起開發,並從邏輯模型轉為物理模型。資料類型和來源必須先知道,後續變更都會導致結構很大的變動 不適合企業架構用來作為廣泛的列和文件儲存,不能在設計層面提供控制
資料查詢效能 Neo4j 使用圖形儲存結構,資料之間的關係附加在節點上,關係的數量或深度變化都能確保即時零延遲 多表聯集查詢中,資料處理效能嚴重受限,如果單一表的行數過大,即使很簡單的連接查詢也會耗費大量資源 支援複雜資料關係的處理能力較弱,必須在應用程式處理所有的資料關係
查詢語言 Cypher 是一種圖查詢語言,提供了描述關係查詢的最有效的表達方式 SQL 查詢語言,其複雜性會隨連接資料查詢所需的 JOIN 操作的數量而增加 查詢語言有所不同,但都沒用於表達資料關係的機制
交易處理 Neo4j 為企業應用程式提供 ACID 交易,來保持全面一致可靠的資料 企業應用程式需要使用 ACID 交易支援,以確保資料的一致性和可用性 基本上無法提供 ACID 交易,因為其資料關係的可用性和一致性是不可靠的
資料庫的擴充性 Neo4j 擴充架構透過主從伺服器間的複製來維護資料完整性。支援 IBM POWER8 和 CAPI Flash 系統進行大規模擴充 透過主從伺服器間的複製進行擴充,成本很高。若資料間有多種複雜關係,會降低的整體效能 擴充可以提升資料的寫入效能,但不能提升讀取效能與保障資料可用性

Neo4j 應用範圍

Risk Management Industry Compliance Master Data Management Miscellaneous Other
Franu Detection Data Lineage Compliance Customer 360 Identity & Access Mgt.
Cyber Security IT Network / Microservices Lead Recommendation
Anti-Money Laundering Knowledge Graph
Complex Entities
Transaction Graph

哪些人需要 Neo4j?Neo4j 實際應用範例

銀行金融保險業

銀行金融保險業的壓力主要來自合規監管風險、網路詐欺風險、內部員工風險,而面對銀行帳戶、地址、客戶數據、政策研究等海量的數據資料,傳統數據資料庫無法有效運作,會耗費內部調查團隊大量時間,當錯誤或風險警報發生時,如何快速發現錯誤並將其追溯至源頭、最大限度地減少損害並減少數據重複,是金融保險業隊的風險挑戰。
Neo4j 產業應用方案:
可視化的圖形數據可對潛在的欺詐案件進行分類,例如:保單、客戶信息、保險財產、財務數據、國家數據庫、黑名單、信譽、所有權…等數據,Neo4j 幫助金融保險業快速識別收到的大量信息中的問題。
台灣國泰金控亦是 Neo4j 的成功使用客戶,通過 4 種風險管理方式可以預防各類銀行風險:
員工管理

員工與親屬、員工與外部企業

客戶管理

財務狀況、徵信、行業、資金流動性、重大事件

關係管理

親屬關係、股權關係、集團關係、業務關係、供應鏈、行業關係

業務管理

業務流程、業務合規、業務資金、業務進展、業務數據

電商零售業

電商零售已成為重要消費趨勢,當消費者進入網站搜索商品時,若能依據搜尋內容中的訊息,快速、精準的發現關聯、進行推斷,提供符合消費者需求的商品,必能取得商機,但往往這些資料的判讀需耗費大量資源,因此是重要挑戰。
Neo4j 產業應用方案:
將知識圖譜與自然語言理解和人工智能相結合,以存儲、紀錄消費者尋找產品時的互動訊息並從中學習,透過 Neo4j 圖形數據庫有助於理解購物場景的概率模型,應用程式會不斷查找庫存與尋找最匹配的商品。

醫療生技業

醫療生技必須針對病毒、疾病、醫藥、基因或實驗相關樣本進行許多測試、累計數據、追縱,並進一步研究分析,其數據錯綜複雜且經常變化,需要許多分層的數據模型, MySQL 數據查詢緩慢與資料一致性必須克服,生技醫療需要有更加靈活、高效的工具來組織、追縱樣本、管理數據並分析其特徵。
Neo4j 產業應用方案:
Neo4j 能將過去累計可用的資料數據導入,在尋找複雜的關係、分析實驗程序、時序紀錄追蹤…等都能以圖形化資料顯示出來,為醫療、生技、疾病監控與預防提供重要資訊。

準備好加入 Neo4j 了嗎?

Gartner Predictis: By 2025, graph technologies will be used in 80% of data and analytics innovations…
  • 更有效率的圖形技術就是未來。圖形資料庫的高可用性、高擴展性,使數據模型能快速適應各種新的業務需求。
  • 圖形技術涵蓋數據科學領域,適用於預測分析、機器學習,針對特定目的的數據能有更多的探索。

Neo4j Community v.s. Neo4j Enterprise

類型 社群版 企業版
授權 開源、免费、非商用環境、僅社群支援 閉源、依據 CPU 核心的授權、叢集、商用環境、專業服務,豐富的應用模組 (例如: Bloom)
伺服器 單機資料庫;單一實例 多實例;多叢集;水平及橫向擴充
安全性 開發者自建 User, Role, https, encryption in transit, property visibility
圖形資料大小 圖形資料大小 無限制
企業強化部署 開發者使用開源版本 Binary testing, Desktop installation & upgrade, HA
擴充 Vertical on single instance Causal Cluster (因果叢集) w/ cores and RR hierarchies.
雲端 開發者自建 Sandbox, BYOL, DBaaS (q4)
開發者的時間價值 開發人員將消耗大量的時間來避免費用產生 Desktop Install, APOC, Algos, Apps, Security, Scale, APIs, Bolt, Admin tools 旨在大幅提高開發人員的生產力並節省大量的開發時間。
應用案例 Analytics, Metadata & non-external, non-critical or non-sensitive projects. Experimental, low skill/expertise. TREC (transaction, real-time, evolving and complex) - change requires backups, HA, security, horizontal scale, geographic scale, etc. RISK (Security, safety, penalty, trustworthiness, experience)
附加模組 開發者自建 (APOC, algos) Desktop, Bloom, Kettle

GDS 中的圖相關演算法 – 超過 70 種

最短路徑及搜尋

  • 最短路徑 Shortest Path
  • 單源最短路徑 Single-Source Shortest Path
  • 任兩點之間的最短路徑 All Pairs Shortest Path
  • A-Star最短路徑 A* Shortest Path
  • YEN-ksp 演算法 Yen’s K Shortest Path
  • 最小權重生成樹 Minimum Weight Spanning Tree
  • k-最小生成樹 K-Spanning Tree (MST)
  • 隨機漫步 Random Walk
中心度 / 重要性

  • 度中心性 Degree Centrality
  • 接近中心性 Closeness Centrality
  • CC Variations: Harmonic, Dangalchev, Wasserman & Faust
  • 介數中心性和近似 Betweenness Centrality & Approximate
  • 網頁排名 PageRank
  • 個性化網頁排名 Personalized PageRank
  • 文檔排名 ArticleRank
  • 特徵向量中心性 Eigenvector Centrality
社群檢測

  • 三角計算法 Triangle Count
  • 叢集係數 Clustering Coefficients
  • 連通元件 Connected Components (Union Find)
  • 強連通元件 Strongly Connected Components
  • 標籤傳播 Label Propagation
  • Louvain模組度 Louvain Modularity
  • K-1著色 K-1 Coloring
  • 模組度優化 Modularity Optimization
連接預測

  • Adamic Adar
  • 共同鄰域 Common Neighbors
  • 偏好依附原則 Preferential Attachment
  • 資源分配 Resource Allocations
  • 相同社群 Same Community
  • 全鄰域 Total Neighbors
相似度

  • 歐幾里得距離 Euclidean Distance
  • 餘弦相似性 Cosine Similarity
  • 節點相似性 Node Similarity (Jaccard)
  • 重疊相似性 Overlap Similarity
  • 皮爾森相似性 Pearson Similarity
  • K-近鄰演算法 Approximate KNN
圖嵌入

  • 隨機圖 Random graph generation
  • 獨熱編碼 One hot encoding
  • 圖神經網路演算法 GraphSAGE
您的企業如何利用圖資料技術,發掘商業優勢,成就更高的業務價值呢?
體驗 Neo4j、完整 Neo4j 介紹及了解實際使用案例,
請即刻洽詢日新科技,將有專人為您服務。