在“百模大戰”打得不可開交的群替輕人時候,一家成立于2023年6月的代T的中中國AI初創企業試圖掀翻2017年谷歌提出的Transformer架構,深入更底層做創新。國年
Transformer是群替輕人目前主流生成式AI所采用的架構,包括引發這一輪AI熱潮的代T的中ChatGPT在內。谷歌發布Transformer架構的國年論文標題說,注意力即為一切(Attention Is All You Need)。群替輕人
這家名為RockAI(巖芯數智)的代T的中中國企業卻想通過架構創新,減少冗余計算和算力消耗,國年要“讓世界上每一臺設備擁有自己的群替輕人智能(Make every device its own intelligence)”。
不到兩年,代T的中他們取得了不錯的國年進展。RockAI做出了Yan架構,群替輕人在2024年1月發布中國首個非Transformer架構Yan1.0大模型,代T的中之后將其迭代至多模態Yan1.3版本,國年可高效處理圖文、語音等多模態信息,適配樹莓派、無人機、機器人、PC、手機等各類終端設備,在弱網環境、硬件和算力不那么高的條件下實現端側智能。
在RockAI位于上海的辦公室,在一個全開放式辦公區里,坐著他們的全部團隊約60人。這一群極客少年工作起來十分投入,叫他們名字時通常會被置若罔聞,必須得拍一下肩膀,對方才可能反應過來。
2025年3月底,南方周末研究員在這里見到了RockAI的兩位聯合創始人劉凡平、鄒佳思。溫和、內斂,甚至還有些斯文,他們的外表和談吐,實在不像是喊出如此張揚口號的野心勃勃的創業者。
實際情況便是如此。他們曾在互聯網大廠里從事過搜索、游戲開發工作,還有過短暫的小型創業經歷,在二三四五網絡科技股份有限公司(以下簡稱“二三四五”,巖山科技(002195.SZ)前身)共事期間一起優化Transformer,窮盡各種可能之后,他們一拍即合,決定創業,建自己的AI架構。
“如果以前是‘軟件定義硬件’,那么未來則是‘智能定義硬件’?!盧ockAI創始人、CEO劉凡平對南方周末表示,智能終端是走向通用人工智能(AGI)的“最優載體”,它的形態將根據需求千變萬化,扮演真正的“變形金剛”(Transformers)角色。
就像ChatGPT引爆生成式人工智能革命,DeepSeek顛覆“算力霸權”,Yan架構和它所處的中國制造生態,能否帶領群體智能走向AGI?
南方周末:你們最早什么時候意識到大模型的效用?
劉凡平:從外界來看大模型好像近兩年才爆發,但我們所學專業和工作經歷都與算法高度相關,在相關技術最初出現時就有感知,2019年團隊做搜索推薦業務時就想用Transformer架構解決問題。幾次嘗試,
2025-05-19 21:52
2025-05-19 21:39
2025-05-19 20:17
2025-05-19 19:50
2025-05-19 19:42
2025-05-19 19:36