日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

押注向量數據庫,為時過早?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-10-07 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科技云報道原創(chuàng)。

在大模型的高調火熱之下,向量數據庫也獲得了前所未有的關注。

近兩個月內,向量數據庫迎來融資潮,Qdrant、Chroma、Weaviate先后獲得融資,Pinecone宣布1億美元B輪融資,估值達到7.5億美元。

東北證券預測,到2030年,全球向量數據庫市場規(guī)模有望達到500億美元,國內向量數據庫市場規(guī)模有望超600億人民幣。

但是在這蒸蒸日上的發(fā)展態(tài)勢下,向量數據庫依然面臨著不可忽視的挑戰(zhàn)。

有聲音認為,不必專門開發(fā)一款純粹的向量數據庫,而是可以在現有數據庫的基礎上添加一些層,賦予其向量檢索的能力。更有業(yè)內人士認為,現在入局向量數據庫可能并非合適的時機。

那么,向量數據庫是否算得上AI時代的標配?其熱度能維持到幾時,此時押注后續(xù)又要擠出多少泡沫?

向量數據庫 大模型的“海馬體”

與傳統數據庫不同,向量數據庫不依賴于結構化格式,而是將數據作為數學向量存儲在高維空間中并對其進行索引

這種方法被稱為“向量化”,可以更有效地搜索相似性并更好地處理復雜的數據類型(圖像、音視頻、自然語言)。

某種程度上,向量數據庫代表了數據存儲和檢索的范式轉變。隨著大模型的興起,向量數據庫的優(yōu)勢得以充分發(fā)揮,甚至有人將其視為AIGC成功的基石。

一種通俗的比方是,行業(yè)內將大模型稱為“大腦”,向量數據庫則是其“海馬體”。

目前的大模型都是預訓練模型,對于訓練截止日之后發(fā)生的事情一無所知,第一是沒有實時的數據,第二是缺乏私域數據或者企業(yè)數據。

向量數據庫可以通過存儲最新信息或者企業(yè)數據有效彌補了這些不足,讓大模型突破在時間和空間上的限制,加速大模型落地行業(yè)場景。

同時,通過向量數據的本地存儲,還能夠協助解決目前企業(yè)界最擔憂的大模型泄露隱私的問題。

不過值得一提的是,向量技術并不新鮮,早在ChatGPT橫空出世之前,向量數據庫非常小眾。前文提到的兩家初創(chuàng)公司Pinecone和Weaviate都成立于2019年,但此前無論是融資還是營收都是乏善可陳的狀態(tài)。

Pinecone聯合創(chuàng)始人兼首席執(zhí)行官Edo Liberty曾坦率地提到,如果沒有ChatGPT的出現,我們根本不可能獲得巨額融資。

軟件服務初創(chuàng)公司Heltar的創(chuàng)始人Avyukt Aggarwal也談到,AIGC的爆火成就了向量數據庫。

“每次淘金熱都會有人賣鏟子。對于生成式AI,鏟子是什么?向量數據庫。幾乎每一個LLM支持的應用程序都在使用它們或即將使用它們。”

向量數據庫 有必要走向專業(yè)化嗎?

向量數據庫系統的誕生,來源于具體業(yè)務需求——想要高效處理海量的向量數據,就需要更細分、更專業(yè)的數據基礎設施,為向量構建專門的數據庫處理系統。

但這種路徑是必須的嗎?

從產品層面講,如果傳統數據庫廠商不單獨研發(fā)向量數據庫,那么基本上會主張支持原生的向量詞嵌入和向量搜索引擎。

向量數據庫市場的陣營,在ChatGPT影響之前就已經在形成分化,既包括提供開源組件的Milvus、Vald、Weaviate、Qdrant、Vaspa、Vearch、AquilaDB、Marqo,到商業(yè)化服務產品Pinecone,再到大廠谷歌推出的Vertex AI匹配引擎,數據庫廠商Elastic和Redis基于自身提供的向量檢索功能等等。

這其實也表明了當前向量數據庫市場存在的兩種路線:

一個是基于分析數據庫的向量化執(zhí)行引擎,英文是Vectorization,這是學術界2013年提出的名詞,如Clickhouse、Spark引擎,是一種新型的執(zhí)行方式,用于處理傳統的結構化數據如表單等,更多的是結構化數據分析數據里面做并行執(zhí)行的一種方式,在新型的處理芯片上進行處理。

另一個則是推出向量數據庫(Vector Database),本質上處理的是AI領域的一類新型數據類型,例如對多模數據的處理,相比其他的向量檢索技術在檢索速度和精準性上都有了一個很高的提升。

后者的做法也基本在幾家主流云廠商如亞馬遜云、阿里云上能夠看到,而這些云平臺應用市場也會提供給這些第三方向量數據庫企業(yè)進行托管。

例如,阿里云開發(fā)的內存數據庫Tair,在兼容Redis生態(tài)的同時,也具備向量檢索能力,實現緩存+向量二合一,已經投入在電商等場景。

有業(yè)內人士認為,對于簡單的用戶和場景來說,在傳統數據庫上添加一個向量分層來滿足技術發(fā)展需求,這種方法是可行的。

然而,考慮到 AI 場景和產業(yè)需求,情況可能有所不同。AI領域的迭代非??欤S著數據量和應用場景的增加,傳統數據庫可能不再適用于高要求的計算密集型場景,向量數據庫可能才是最終的解決方案。

押注向量數據庫 挑戰(zhàn)頗多

作為今年以來的熱門技術賽道,向量數據庫已吸引了大量廠商和創(chuàng)業(yè)團隊入場,先發(fā)者與后來者,老牌廠商與新生力量之間的競爭正在持續(xù)升溫。

但值得注意的是,向量數據庫真的值得廠商全力投入嗎?

在《為什么你不應該投資向量數據庫?》一文中,吳英駿表示,現在入局向量數據庫可能并非合適的時機。其理由主要集中于以下幾點:

其一,先發(fā)優(yōu)勢明顯。目前向量化技術目前已十分成熟,并存在大量開源解決方案,在不同的領域也存在不同的向量化方案,潛在用戶可以很容易地在現有市場中找到合適的選擇。

其二,需求層次不同。如果一家公司已經采用了Elastic,Redis,SingleStore或Rockset等商業(yè)數據庫,并且不需要高度先進的向量搜索功能,則可以充分利用這些數據庫的現有功能。

盡管在向量數據處理方面的表現不如專業(yè)的向量數據庫,但依然可以滿足多數用戶的一般要求。

其三,技術在不斷前進。隨著數據庫領域技術的進步,越來越多的數據庫會考慮納入向量搜索功能,以滿足當前用戶群的需求。對于目前缺乏向量搜索功能的數據庫,實現這些功能或許只是時間問題。

也有聲音認為,相較于大模型的高調火熱,向量數據庫仍然靠近底層,并沒有達到真正意義上的全民皆知,向量數據庫更多時候是需要集成到其他平臺或云上被銷售。

而從需求端看,過去向量檢索還主要聚焦于機器學習和數據挖掘領域,通過高效的數據存儲和查詢工具,使得相似性搜索和聚類分析成為可能。

在推薦系統中,向量數據庫助力個性化推薦,根據用戶興趣和商品相似性,呈現給用戶最貼切的推薦結果。

簡言之,“與其投資新的向量數據庫項目,不如集中精力于現有數據庫,并探索利用向量引擎增強這些數據庫的機會,使其更加健壯和強大”。

結語

無論如何,在技術的快速迭代下,數據庫市場的持續(xù)擴張是不可避免的。當前存在著大量的需求,將吸引越來越多的數據庫甚至向量數據庫加入競爭。

不過從長遠來看,向量數據庫的市場需求尚處于初期,中遠期規(guī)模尚難以預估。在若干輪優(yōu)勝劣汰之后,我們或許才能看清誰是真正的執(zhí)棋者。

【關于科技云報道】

專注于原創(chuàng)的企業(yè)級內容行家——科技云報道。成立于2015年,是前沿企業(yè)級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創(chuàng)報道云計算、大數據、人工智能區(qū)塊鏈等領域。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    41320

    瀏覽量

    302703
  • 數據庫
    +關注

    關注

    7

    文章

    4085

    瀏覽量

    68569
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Oracle數據庫ASM實例無法掛載的數據恢復案例

    一個Oracle數據庫故障表現為ASM磁盤組掉線,ASM實例無法掛載(mount)。數據庫管理員自行進行簡單修復,未能成功,隨后聯系北亞數據恢復中心恢復數據。
    的頭像 發(fā)表于 02-24 15:19 ?229次閱讀
    Oracle<b class='flag-5'>數據庫</b>ASM實例無法掛載的<b class='flag-5'>數據</b>恢復案例

    艾體寶干貨 | 多模型數據庫解決的到底是什么問題?

    數據庫選型的專業(yè)討論中,“多模型數據庫”已逐步成為熱點概念,但行業(yè)對其認知仍存在偏差——要么被曲解為“無所不能的萬能數據庫”,要么被簡化為“圖數據庫與文檔
    的頭像 發(fā)表于 02-03 16:08 ?419次閱讀

    國產數據庫的AI戰(zhàn)事

    國產數據庫硝煙再起,Vastbase V100構筑企業(yè)智能基座
    的頭像 發(fā)表于 10-24 20:45 ?4485次閱讀
    國產<b class='flag-5'>數據庫</b>的AI戰(zhàn)事

    電磁環(huán)境數據庫管理系統平臺軟件解析

    電磁環(huán)境數據庫管理平臺軟件解析(精簡版)
    的頭像 發(fā)表于 09-15 21:00 ?498次閱讀
    電磁環(huán)境<b class='flag-5'>數據庫</b>管理系統平臺軟件解析

    數據庫性能優(yōu)化指南

    作為一名在大廠摸爬滾打多年的運維老兵,我見過太多因為數據庫性能問題導致的生產事故。今天分享一套完整的數據庫優(yōu)化方法論,從SQL層面到硬件配置,幫你徹底解決性能瓶頸!
    的頭像 發(fā)表于 08-18 11:21 ?921次閱讀

    數據庫數據恢復—服務器異常斷電導致Oracle數據庫故障的數據恢復案例

    Oracle數據庫故障: 某公司一臺服務器上部署Oracle數據庫。服務器意外斷電導致數據庫報錯,報錯內容為“system01.dbf需要更多的恢復來保持一致性”。該Oracle數據庫
    的頭像 發(fā)表于 07-24 11:12 ?874次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—服務器異常斷電導致Oracle<b class='flag-5'>數據庫</b>故障的<b class='flag-5'>數據</b>恢復案例

    三款主流國產數據庫的技術特點

    隨著數字經濟的快速發(fā)展和數據安全要求的提升,國產數據庫正迎來前所未有的發(fā)展機遇。在信創(chuàng)浪潮推動下,達夢數據庫、TiDB、華為高斯數據庫等國產數據庫
    的頭像 發(fā)表于 07-14 11:08 ?1365次閱讀

    企業(yè)級MySQL數據庫管理指南

    在當今數字化時代,MySQL作為全球最受歡迎的開源關系型數據庫,承載著企業(yè)核心業(yè)務數據的存儲與處理。作為數據庫管理員(DBA),掌握MySQL的企業(yè)級部署、優(yōu)化、維護技能至關重要。本文將從實戰(zhàn)角度出發(fā),系統闡述MySQL在企業(yè)環(huán)
    的頭像 發(fā)表于 07-09 09:50 ?919次閱讀

    milvus向量數據庫的主要特性和應用場景

    Milvus 是一個開源的向量數據庫,專門為處理和分析大規(guī)模向量數據而設計。它適用于需要高效存儲、檢索和管理向量
    的頭像 發(fā)表于 07-04 11:36 ?1263次閱讀
    milvus<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>的主要特性和應用場景

    數據庫數據恢復—MongoDB數據庫文件丟失的數據恢復案例

    MongoDB數據庫數據恢復環(huán)境: 一臺操作系統為Windows Server的虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 工作人員在MongoDB服務仍
    的頭像 發(fā)表于 07-01 11:13 ?815次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—MongoDB<b class='flag-5'>數據庫</b>文件丟失的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫被加密如何恢復數據?

    SQL Server數據庫故障: SQL Server數據庫被加密,無法使用。 數據庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?871次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>被加密如何恢復<b class='flag-5'>數據</b>?

    達夢數據庫常用管理SQL命令詳解

    達夢數據庫常用管理SQL命令詳解
    的頭像 發(fā)表于 06-17 15:12 ?7691次閱讀
    達夢<b class='flag-5'>數據庫</b>常用管理SQL命令詳解

    oracle數據恢復—oracle數據庫誤執(zhí)行錯誤truncate命令如何恢復數據?

    oracle數據庫誤執(zhí)行truncate命令導致數據丟失是一種常見情況。通常情況下,oracle數據庫誤操作刪除數據只需要通過備份恢復數據
    的頭像 發(fā)表于 06-05 16:01 ?1863次閱讀
    oracle<b class='flag-5'>數據</b>恢復—oracle<b class='flag-5'>數據庫</b>誤執(zhí)行錯誤truncate命令如何恢復<b class='flag-5'>數據</b>?

    SQLSERVER數據庫是什么

    SQL Server 是由微軟公司開發(fā)的一款 關系型數據庫管理系統(RDBMS) ,用于存儲、管理和檢索結構化數據。它是企業(yè)級應用中廣泛使用的數據庫解決方案之一,尤其適用于Windows平臺,但也
    的頭像 發(fā)表于 05-26 09:19 ?1321次閱讀

    MySQL數據庫是什么

    MySQL數據庫是一種 開源的關系型數據庫管理系統(RDBMS) ,由瑞典MySQL AB公司開發(fā),后被Oracle公司收購。它通過結構化查詢語言(SQL)進行數據存儲、管理和操作,廣泛應用于Web
    的頭像 發(fā)表于 05-23 09:18 ?1476次閱讀
    岳阳市| 福泉市| 扬中市| 明溪县| 武强县| 南昌市| 婺源县| 长春市| 呈贡县| 杭锦后旗| 德清县| 明水县| 徐州市| 舟山市| 惠来县| 马公市| 元阳县| 聂拉木县| 公主岭市| 营山县| 顺平县| 平陆县| 台北县| 长白| 普兰店市| 微山县| 翁牛特旗| 马尔康县| 寿光市| 南汇区| 兴义市| 满洲里市| 松桃| 彝良县| 丹寨县| 苗栗市| 额济纳旗| 遂昌县| 汉源县| 天台县| 贵南县|