2023年11月中下旬,忙宮模型OpenAI經(jīng)歷了一場不斷反轉(zhuǎn)的用忙人事動蕩,并以Sam Altman重新被任命為OpenAI CEO暫告一段落。上新
劇情撲朔迷離,丨科確實吸引了足夠多的創(chuàng)聞眼球。一家明星公司、忙宮模型一位明星CEO,用忙真的上新能左右AI在人類世界的發(fā)展進程嗎?不妨看看更多企業(yè)在AI大模型升級和應(yīng)用方面的努力。
11月21日,丨科來自美國加州舊金山的創(chuàng)聞AI初創(chuàng)企業(yè)Anthropic推出Claude 2.1 AI模型,支持輸入多達20萬個Token,忙宮模型超過了OpenAI大型模型GPT-4 Turbo的用忙12.8萬個Token,可以處理更長文本的上新內(nèi)容,同時還新增同系統(tǒng)預(yù)設(shè)提示詞(System Prompt)功能。丨科Anthropic稱,創(chuàng)聞Claude2.1的準確率是Claude2.0的兩倍,增強了對于文本內(nèi)容的理解能力,特別是在處理法律文件、財報與技術(shù)規(guī)格等更高準確度的文檔時。
正如OpenAI和微軟的合作,Anthropic和谷歌站在了一起。2023年11月初,Anthropic宣布將采用谷歌的芯片Cloud TPU v5e來支持其大模型,并使用其云計算服務(wù),而谷歌則在2023年10月承諾將向其投資20億美元,前期已經(jīng)投入5億美元。
另外,由谷歌旗下DeepMind AI研究小組聯(lián)合創(chuàng)始人Mustafa Suleyman、DeepMind AI首席科學(xué)家Karén Simonyan和 LinkedIn聯(lián)合創(chuàng)始人Reid Hoffman于2023年3月共同成立的企業(yè)Inflection AI,在11月22日發(fā)布了新一代大模型Inflection-2,并稱它是全球第二代大語言模型(LLM)。Inflection-2在5000塊英偉達H100 GPU上進行FP8混合精度訓(xùn)練,具備約10^25次FLOP計算能力,和谷歌的PaLM 2 Large模型處于同一訓(xùn)練計算類別,并在MMLU、TriviaQA、HellaSwag和GSM8k等大多數(shù)AI基準測試中,優(yōu)于PaLM 2,部分測試僅次于OpenAI的GPT-4。