網(wǎng)站首頁 / 新浪博客 / AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場

天宇殤新浪博客 2024-09-13 22 0

【新澳门内部资料精准大全】

【2024澳门天天开好彩大全】

【管家婆一肖-一码-一中一特】

【澳门一肖一码必中一肖一码】

【2024澳门正版资料免费大全】

【澳门一肖一码100准免费资料】

【2024澳门特马今晚开奖】

【2024正版资料大全免费】

【2024澳门天天六开彩免费资料】

【澳门今晚必中一肖一码准确9995】

【澳门资料大全正版资料2024年免费】

【澳门2024正版资料免费公开】

【澳门天天开彩好正版挂牌】

【2024澳门天天六开彩免费资料】

【澳门一码一肖一特一中2024】

【澳门管家婆一肖一码100精准】

【澳门王中王100%的资料】

【今期澳门三肖三码开一码】

【2024澳门天天开好彩大全】

【2024一肖一码100精准大全】

【494949澳门今晚开什么】

【香港二四六开奖免费资料】

【澳门平特一肖100%免费】

【7777888888管家婆中特】

【澳门管家婆一肖一码一中一】

【2024澳门天天六开彩免费资料】

　　來源：財(cái)聯(lián)社

　　北京時間周五凌晨1時許，AI時代迎來嶄新的起點(diǎn)——能夠進(jìn)行通用復(fù)雜推理的大模型終于走到臺前。

　　OpenAI在官網(wǎng)發(fā)布公告稱，開始向全體訂閱用戶開始推送OpenAI o1預(yù)覽模型——也就是此前被廣泛期待的“草莓”大模型。OpenAI表示，對于復(fù)雜推理任務(wù)而言，新模型代表著人工智能能力的嶄新水平，因此值得將計(jì)數(shù)重置為1，給它一個有別于“GPT-4”系列的全新名號。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第1張

　　推理大模型的特點(diǎn)，就是AI會在回答之前花更多時間進(jìn)行思考，就像人類思考解決問題的過程一樣。以往的大模型，背后的邏輯是通過學(xué)習(xí)大量數(shù)據(jù)集中的模式，來預(yù)測單詞生成的序列，嚴(yán)格來說并不是真正理解提問。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第2張

　　認(rèn)知將躍升至“理科博士生水準(zhǔn)”

　　OpenAI曾解釋過，2023年發(fā)布的GPT-4類似于高中生的智能水平，而GPT-5則是完成AI從“高中生躍升至博士”的成長。這個o1模型就是其中關(guān)鍵的一步。

　　相較于GPT-4o等現(xiàn)有的大模型，OpenAI o1能夠解決更加困難的推理問題，同時改善過往模型中存在的機(jī)制性缺陷。

　　舉例而言，這個新模型能夠數(shù)清楚strawberry里到底有幾個“r”。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第3張

　　同時AI在解答編程問題時也會更有條理，在著手寫代碼前，把整個回答的流程全部思考完一遍，再動手輸出代碼。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第4張

　　例如在預(yù)設(shè)條件的寫詩任務(wù)（例如第二句的最后一個單詞需要以i收尾）中，“拿起筆就寫”的GPT-4o的確給出了回答，但往往只會滿足了一部分條件，同時不會自我糾正。這意味著AI必須在第一次生成時就能碰上正確的答案，否則就一定會出錯。但在o1模型中，AI會不斷試錯并打磨答案，從而顯著提高生成結(jié)果的準(zhǔn)確率和質(zhì)量。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第5張

　　有趣的是，點(diǎn)開AI思考的過程，還會出現(xiàn)AI表示“我在思考這個事情這么做行不行”、“啊時間不夠了得盡快給出答案”等。OpenAI確認(rèn)，這里展示的并不是原始的思維鏈，而是“模型生成的摘要”，公司也坦率承認(rèn)這里有保持“競爭優(yōu)勢”的因素。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第6張

　　OpenAI的研究負(fù)責(zé)人Jerry Tworek透露，o1模型背后的訓(xùn)練與之前的產(chǎn)品有著根本性的區(qū)別。之前的GPT模型旨在模仿其訓(xùn)練數(shù)據(jù)中的模式，而o1的訓(xùn)練旨在讓其獨(dú)立解決問題。在強(qiáng)化學(xué)習(xí)的過程中，使用獎勵和懲罰機(jī)制來“教育”AI使用“思維鏈”來處理問題，就像人類習(xí)得拆解、分析問題的方式一樣。

　　根據(jù)測試，o1模型在國際數(shù)學(xué)奧林匹克的資格考試中，能夠拿到83%的分?jǐn)?shù)，而GPT-4o只能正確解決13%的問題。而在編程能力比賽Codeforces中，o1模型拿到89%百分位的成績，而GPT-4o只有11%。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第7張

　　OpenAI表示，根據(jù)測試，在下一個更新的版本中，AI在物理、化學(xué)和生物學(xué)的挑戰(zhàn)性基準(zhǔn)測試中，表現(xiàn)能夠與博士生水平類似。

　　該講講缺點(diǎn)和局限性了

　　不難理解，會自己思考問題的AI模型，對于程序員、創(chuàng)意工作者，以及幾乎所有的理科相關(guān)專業(yè)工作者而言是有益的升級，但這個新模型也有局限性。

　　首先，OpenAI o1模型（至少目前）還不是多模態(tài)大模型，同時在回答事實(shí)性問題時也不如其他模型。所以在圖像互動、常識問答、互聯(lián)網(wǎng)搜索方面，GPT-4o依然是更勝一籌的選擇。當(dāng)然，OpenAI明確表示未來會給這個模型增加聯(lián)網(wǎng)、文件和圖像上傳等功能。

　　另一個問題則是貴，而且是非常貴。o1-預(yù)覽模型的定價是每百萬個輸入tokens 15美元，每百萬個輸出tokens 則要60美元，分別是GPT-4o的3倍和4倍。一百萬tokens大致相當(dāng)于75萬個英文單詞。

AI新時代揭幕！會“思考解題邏輯”的OpenAI推理大模型登場第8張