KIOXIA單伺服器實現48億高維度向量搜尋資料庫,藉助GPU實現索引建構時間加快7.8倍
憑藉NVIDIA cuVS庫和KIOXIA AiSAQ技術,以極低DRAM用量完成1024維度向量索引
東京--(美國商業資訊)-- Kioxia Corporation今日宣布,憑藉其開放原始碼的KIOXIA AiSAQ™近似最近鄰搜尋(ANNS)技術,成功示範在單台伺服器上實現48億向量的高維度向量搜尋擴充。此外,Kioxia還展示了透過NVIDIA cuVS利用GPU加速,顯著縮短索引建構時間的成果。這兩項成果代表檢索強化生成(RAG)搜尋解決方案取得了重大進展。目前公司正持續開發,以支援超過48億向量的更大規模部署。
大規模向量資料庫的索引建構時間是產業的核心痛點。Kioxia與NVIDIA合作,示範其在1024維度高維度向量的KIOXIA AiSAQ索引建構時間上最多20倍的改進,以及端對端建構時間上最多7.8倍的改進。這20倍的改進表示,建構索引的時間從使用CPU的28.4天縮短至使用4塊NVIDIA Hopper GPU的1.4天,端對端測試時間從31天縮短至4天。1
如今,AI應用程式可依賴儲存在固態硬碟上的更大規模向量化資訊(可達數百億向量及以上),而僅靠DRAM即便在十億級規模下也已不再適用。Kioxia藉助KIOXIA AiSAQ技術,實現了十億級搜尋的高可擴充儲存架構,在Milvus向量資料庫環境中,使用單台查詢伺服器即可滿足RAG應用程式的延遲要求。其索引建構憑藉GPU加速,讓大規模部署變得切實可行。
NVIDIA儲存技術副總裁Jason Hardy表示:「向量資料庫是那些需要在海量非結構化資料集中即時理解意圖、上下文和相似度的應用程式的核心支撐。透過藉助NVIDIA cuVS庫實現GPU加速索引,Kioxia支援高維度向量資料庫實現擴充,並以前所未見的效率建構索引。」
KIOXIA AiSAQ開放原始碼軟體技術於去年首次發表,透過支援直接從固態硬碟進行向量搜尋並降低DRAM用量,解決了RAG技術的可擴充性挑戰。KIOXIA AiSAQ技術具備高可擴充性,非常適合多租戶環境和大規模單體索引部署。該技術採用創新的全域索引(Global Index)演算法,結合混合式分群和圖搜尋,在超大規模下實現高效向量搜尋。KIOXIA AiSAQ軟體提供靈活的調校選項,可在效能與大規模向量可擴充性之間取得平衡,讓大規模部署更易實現和擴充。
Kioxia Corporation常務執行董事、固態硬碟事業部副總裁Masashi Yokotsuka表示:「將向量資料庫擴充至十億級規模,需要重新思考記憶體和運算方案。透過將以KIOXIA AiSAQ固態硬碟為基礎的向量搜尋與NVIDIA用於索引建構的GPU加速相結合,我們實現了大規模部署下切實可行的索引建構。身為業界創新企業,我們將繼續利用快閃記憶體技術突破AI的邊界。」
Kioxia始終致力於推進由儲存驅動的AI解決方案,以支援大規模智慧資料處理,並持續推動KIOXIA AiSAQ向兆向量級部署邁進。
KIOXIA AiSAQ開放原始碼軟體下載連結:https://github.com/kioxia-jp/aisaq-diskann。
|
註: |
|
1. 本次基準測試共處理了19.66 TB向量資料。效能或基準測試結果可能因主機裝置、讀寫條件、資料大小及其他因素而有所不同。 |
|
KIOXIA AiSAQ是KIOXIA的商標。 |
|
公司名稱、產品名稱和服務名稱可能第三方公司的商標。 |
關於 Kioxia
Kioxia是全球記憶體解決方案領域的領軍企業,致力於快閃記憶體和固態硬碟(SSD)的開發、生產和銷售。其前身是Toshiba Memory,於2017年4月從1987年發明了NAND快閃記憶體的公司Toshiba Corporation脫售而出。Kioxia致力於透過提供產品、服務和系統來為客戶創造選擇,並為社會創造以儲存技術為基礎的價值,從而提升世界的「記憶」。Kioxia創新的3D快閃記憶體技術BiCS FLASH™正在塑造儲存技術在高密度應用領域(包括高階智慧型手機、PC、汽車系統、資料中心和生成式AI系統)的未來。
本文件中的資訊(包括產品價格和規格、服務內容和聯絡方式)在公告發表之日是正確的,但如有更改,恕不另行通知。
免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。
- Flexport飛協博推出自動化關稅退稅技術
- YY Group拓展香港酒店業務版圖,啟動與12家頂級酒店的人力服務合作
- 中國大人集團有限公司宣佈將積極探索佈局算力產業
- Lenovo與NVIDIA攜手推進十億瓦級AI工廠計畫,加快企業級AI落地進程
- 鄉郊豐年節2026:「香港山水.聲舞」一日音樂節盛大舉行
- 世盟供應鏈啟動A股IPO 最大外部股東首程控股(0697.HK)投資價值步入兌現期
- 費列羅集團公布20242025財政年度綜合財務表現
- 銀聯攜手 25 個境外電子錢包,支援在中國大陸掃碼微信支付
- MiniMax發佈2025年全年業績
- 科技向善,暖港行動:Web3金融科技行業以「資金+人力」雙線響應香港大埔火災
- Colgate-Palmolive與WHO基金會宣布建立全球口腔健康合作夥伴關係
- 「歡喜就好」----週末戲相逢金門脫口秀活動首次走進金門
- SWI Capital Holding Ltd 於阿姆斯特丹泛歐交易所上市
- 技嘉推出支援 Intel® Core™ Ultra 200S PLUS 系列處理器與 CQDIMM 技術的 Z890 PLUS 系列主機板
- Caidya任命Michael Clay為營運長,推動卓越營運和多區域臨床研發
- 駐穗總領事聚焦2026年深圳APEC會議
- 全球媒體聚焦晶澳科技DeepBlue 5.0重新定義高價值光伏未來
- 讓智能在實驗中進化:恩和科技發布 SAION AI - 面向生物制造的物理智能平台
- 氫能基礎建設邁向商業化:TÜV SÜD完成台灣首座加氫站安全性測試
- 從雲端到生活:華龍航空發布2025天合臻選「公務機+」生態
- Select Property曼徹斯特代表性住宅項目One Port Street落成
- 新春赴日旅行獲贈獨家限定禮品:Wakamoto啟動「Wakamoto感恩回饋」活動
- 擎朗人形機器人入駐酒店打工,打造首個通用+專用機器人協作模式
- LambdaTest 宣佈易名為 TestMu AI,推全球首個全自動代理式品質工程平台
- FITUR 2026 擴增旅遊科技展區面積達 50%,強化其作為創新旅遊對話核心樞紐的領導地位
- CGTN AMERICA 及 CCTV UN:CMG 在紐約市呈獻《春晚倒數》共賀馬年
- 美商賀寶芙連續 6 年力挺臺北馬拉松
- 2026 DotAI 年度大會圓滿舉行
- Havas 行政總裁與 Vivendi 董事長將於 2026 年 CES 主題演講中,共同揭示人類與人工智能共創的宏偉願景
- Parse Biosciences與Graph Therapeutics達成合作,共建大型功能性免疫擾動圖譜





