|
「整數(shù)智能」獲數(shù)千萬 Pre A 輪融資,AI 大模型重構數(shù)據(jù)標注生產(chǎn)效率36 氪獲悉,AI 數(shù)據(jù)公司「整數(shù)智能」于近期完成了數(shù)千萬 Pre A 輪融資,本輪由翊宙資本、藕舫天使、安益盛銀、圖靈啟真投資,翊尚資本為獨家融資顧問。 據(jù)悉,本輪融資主要用于智能數(shù)據(jù)工程平臺(ABAVA Platform)的迭代升級,全新的 ABAVA 平臺將集成 AI 大模型 + 小模型,實現(xiàn)高效自動化數(shù)據(jù)標注。此外,整數(shù)智能還將集成 RLHF(人類反饋強化學習)數(shù)據(jù)服務能力,為大語言模型(LLM)的研發(fā)與迭代提供方案。 整數(shù)智能發(fā)展于浙江大學計算機創(chuàng)新技術研究院,致力于為人工智能企業(yè)及科研院所提供一站式數(shù)據(jù)管理服務。其提供的智能數(shù)據(jù)工程平臺(ABAVA Platform)與數(shù)據(jù)集構建服務(ACE Service),能夠滿足自動駕駛、AIGC、智慧醫(yī)療等數(shù)十個應用場景的數(shù)據(jù)需求。 目前,公司已合作國內(nèi)外頂級科技公司與科研機構數(shù)百家,擁有知識產(chǎn)權數(shù)十項,多次參與人工智能領域的標準與白皮書撰寫。 整數(shù)智能創(chuàng)始人林群書為浙江大學計算機博士生,聯(lián)合創(chuàng)始人趙子健為浙江大學法學碩士生,目前均處于休學創(chuàng)業(yè)中。 林群書認為,正如人工智能公司 OpenAI 的聯(lián)合創(chuàng)始人 Ilya Sutskever 所說,"Training data is technology",OpenAI 訓練的 GPT-3 大模型,有 1750 億參數(shù)。作為 AI 領域的基礎設施,數(shù)據(jù)工程是人工智能時代絕對值得 All in 的機會。 他告訴 36 氪,當下數(shù)據(jù)標注正在從人力密集型向自動化標注過渡。以 Tesla 為例,在 2018 年,一段 clip 數(shù)據(jù)需要花費 500 小時的人工標注。隨著 Tesla 通過對數(shù)據(jù)引擎及自動化標注能力的重點建設,到 2021 年,一段 clip 數(shù)據(jù)的標注只需要花費 0.5 小時的算力標注 +0.1 小時的人工標注即可。 針對人工智能行業(yè)發(fā)展的大趨勢,整數(shù)智能推出了智能數(shù)據(jù)工程平臺(ABAVA Platfom),對人工智能所需的數(shù)據(jù)標注工具套件進行了全域覆蓋,包含圖像、點云、文本、音頻等多模態(tài)標注工具。 林群書表示,行業(yè)當前的自動化標注,更多依賴算法工程師打磨特定場景的自動化標注算法,通用性有限。跨行業(yè)或跨場景時,如果算法自動化標注的精度下降,會需要工程師花費額外的時間精力,對自動化標注算法進行手動升級。 而 ABAVA 平臺,其內(nèi)置的 AI Power 系統(tǒng)通過結合 AI 大模型與小模型各自的優(yōu)點,能夠快速在新行業(yè)或新場景進行自動化標注,并且不斷提升自動化標注的精度,使得獲取高質(zhì)量數(shù)據(jù)的時間成本與人力成本不斷降低。 簡單來說就是,能夠跨越不同行業(yè)、不同場景實現(xiàn)自動化標注;同時還能利用標注好的數(shù)據(jù)來迭代算法模型。" 使用時間越長,沉淀數(shù)據(jù)越多,自動化標注水平也就越高。" 林群書說道。 4D 標注工作界面 圖源整數(shù)智能 此外,整數(shù)智能針對自動駕駛場景,推出了 4D 標注工具,即在三維空間數(shù)據(jù)的基礎上疊加時間維度的序列信息進行場景重建,目前已能支持視覺重建與點云重建。據(jù)林群書介紹,其 4D 標注工具可以把原本需要數(shù)十幀的標注工作,極限壓縮到一幀來進行,將數(shù)據(jù)標注的效率提升數(shù)十倍。 4D 標注工具的研發(fā)難點在于,其一需要使用算法融合多幀數(shù)據(jù)進行場景重建,重建的質(zhì)量尤為重要,直接影響后續(xù)的投影精度;其二在于重建后的點云密度非常高,給 Web 端點云工具的性能優(yōu)化帶來巨大挑戰(zhàn);其三在于完成標注后的結果如何精確的投影回 2D 空間,需要做大量的算法優(yōu)化。 總的來看,林群書告訴 36 氪,人工智能時代獲取「數(shù)據(jù)能源」將經(jīng)歷人工標注、自動標注、合成數(shù)據(jù)三個發(fā)展階段。目前整數(shù)智能能夠通過自動標注大幅降低獲取數(shù)據(jù)的成本。 隨著 AI 大模型時代到來,整數(shù)智能也在探索合成數(shù)據(jù)的模式。比如通過 AI 合成數(shù)據(jù),可以解決自動駕駛缺乏 Corner case 場景數(shù)據(jù)的問題。 整數(shù)智能認為,AI 大模型時代,數(shù)據(jù)消耗的速度將遠遠大于數(shù)據(jù)自然產(chǎn)生的速度,通過合成數(shù)據(jù)的技術路徑,可以帶來「數(shù)據(jù)能源」獲取方式的一次革命。"AIGC(即 AI 生成內(nèi)容,如 AI 生成圖片)的技術爆炸,技術效果和效率會遠遠超過自動化標注。" |