重慶人工智能領(lǐng)域,出現(xiàn)了新的世界紀錄。近日,我市人工智能領(lǐng)域的頭部企業(yè)——重慶中科云從科技有限公司(云從科技)的視覺大模型取得重要進展,其行人基礎大模型在PA-100K、RAP V2、PETA、HICO-DET四個數(shù)據(jù)集上刷新世界紀錄。
(資料圖片)
8月16日,記者從云從科技了解到,一口氣刷新四項世界紀錄的背后,有位“秘密功臣”——云從科技開發(fā)的從容大模型。
計算機視覺和人工智能相關(guān)領(lǐng)域“領(lǐng)跑”
曾連續(xù)三年三次打破世界紀錄
新紀錄是如何誕生的?
云從科技研究院算法工程師焦賓介紹,這是行人基礎大模型在公開測試集上“跑”出成績后,和全球范圍內(nèi)已知最佳成績對比的結(jié)果。今后,這一成績還可能繼續(xù)被刷新。
▲云從科技在PA-100K、RAP V2、PETA行人屬性數(shù)據(jù)集上的表現(xiàn)。受訪者供圖
這不是云從科技第一次打破世界紀錄。自2015年成立以來,其一直在計算機視覺和人工智能相關(guān)領(lǐng)域“領(lǐng)跑”。2018年至2020年,云從科技跨鏡追蹤技術(shù)就曾連續(xù)三年三次打破世界紀錄。
而行人基礎大模型的“特長”更為豐富,它可以精確高效地識別與人相關(guān)的特征,如面部特征、衣服顏色、眼鏡和手表等配飾;同時還能精準識別人與物體的交互,如抽煙、使用智能手機等行為。
這就意味著,行人基礎大模型既可以辨認“人”,也可以辨認“人在干什么”,從而具備了大規(guī)模商用的可能性。
大模型的“聰明”程度比起以往模型
就像大學生“PK”小學生
為啥大模型的識別能夠精準高效?
焦賓解釋,這得益于云從科技研發(fā)的云從從容大模型的支撐。
“大模型的‘大’,體現(xiàn)在參數(shù)量大、數(shù)據(jù)量大、算力資源量大三個方面?!苯官e說,通俗地說,這使得大模型的“聰明”程度比起以往的模型,就像大學生“PK”小學生。
首先,十億級的參數(shù)量,意味著大模型能夠容納的場景極為豐富。它像一個巨大的“底座”,可以容納和匹配各類生產(chǎn)生活場景,根據(jù)用戶需求“微調(diào)”小部分參數(shù)即可。
例如,在安全領(lǐng)域中,大模型既能識別在禁煙區(qū)抽煙的行為,也能“抓住”駕駛時接打手機的不規(guī)范操作。
而過去,不同的場景需要單獨開發(fā)不同的模型,不僅造成了數(shù)據(jù)壁壘,也使得研發(fā)和使用成本更高。
其次,百億級的數(shù)據(jù)量,意味著大模型的“知識”更“豐富”。在海量數(shù)據(jù)的訓練下,大模型擁有出色的視覺識別能力。記者在云從科技看到,只需給出一張圖片,大模型便能在秒級范圍內(nèi)識別出圖中的人、物體和行為,并給出文字反饋。
再次,算力資源大,意味著大模型的“反應”更快。今年5月落地兩江新區(qū)的云從科技西部智算中心擁有最高可達5000P的算力,能支撐復雜、大規(guī)模的計算。這也標志著云從從容大模型生產(chǎn)線正式投產(chǎn)。
多項技術(shù)進入“實戰(zhàn)”
已用于礦山、建筑工地以及特殊場所的安全布控
焦賓表示,行人基礎大模型的優(yōu)秀表現(xiàn),意味著該技術(shù)已經(jīng)進入大規(guī)模商用階段。
記者了解到,基于云從從容大模型平臺的多項技術(shù)已經(jīng)進入了“實戰(zhàn)”。目前廣泛應用于礦山、建筑工地以及特殊場所的安全布控。
云從科技也在涉獵更多領(lǐng)域。今年7月,云從科技、佳都科技、重慶交通開投集團就深入開展城市交通技術(shù)研發(fā)及應用落地達成戰(zhàn)略合作,并正式發(fā)布知行城市交通行業(yè)大模型。
接下來,三方將共同圍繞重慶軌道交通在建和擬建項目需求以及相關(guān)城市交通痛點,開展城市交通行業(yè)大模型Trans-GPT研究、綜合監(jiān)控智慧節(jié)能等方面的創(chuàng)新研究和應用落地,提升重慶智慧交通水平,打造全球智慧交通高地。
8月4日,云從科技還參加了第十四屆海峽兩岸(廈門)文化產(chǎn)業(yè)博覽交易會,基于云從從容大模型帶來多項核心AIGC產(chǎn)品及行業(yè)案例亮相,積極賦能文化產(chǎn)業(yè)發(fā)展。
標簽: