阿裏釋出GPT-o1的開源實作，用AI解決沒有標準答案的復雜問題。

2024-11-23碼農

用過GPT-o1的都知道，o1的能力要明顯強於GPT4，原因是 o1有擬人化的思考模式 ，能把一個復雜問題拆解成小問題，讓整個的推理任務更加嚴謹。

去年阿裏還經常被網友噴，因為在Github上掛了很多不開源的DEMO。

士別三日當刮目相待。

要說今年阿裏是真的猛，開源了巨多AI計畫。

Qwen已經是在很多開源的AI計畫裏被經常「標配」的大模型了。

阿裏這幾天又開源了Marco-o1，也算是對GPT-o1的開源實作吧。

Marco-o1的論文裏也講了，是受了o1的啟發。

掃碼加入AI交流群

獲得更多技術支持和交流

（請註明自己的職業）

計畫簡介

Marco-o1 是由阿裏巴巴 MarcoPolo 團隊開發的大型推理模型，透過復雜的實際問題解決任務最佳化人工智慧的推理能力。Marco-o1利用鏈式思考（CoT）微調、蒙特卡羅樹搜尋（MCTS）和反思機制，提高了問題解決的精確度和廣度。Marco-o1套用於數學、物理和編程等領域，並且致力於開放式解決方案，特別是在難以量化獎勵的領域內具有廣泛的適用性和優越的效能。

開放式解決方案，實際就是針對沒有標準答案的問題來做出更好的回答。

DEMO

這是一個測試大模型經典的「草莓」問題，strawberry中有多少個「r」。

答案是3沒問題，但粉色框裏的推理過程中可以看到，最後一個字母「y」被忽略掉了，還是有進步空間的。