奇多多AI學伴亮相2025云棲大會,無界方舟用AI“慧眼”開啟智能早教時代

轉載 網絡 | 2025年09月30日
奇多多AI學伴亮相2025云棲大會,無界方舟用AI“慧眼”開啟智能早教時代 ......

在近日舉辦的2025云棲大會現場,無界方舟推出的國內首款基于「端到端實時多模態互動模型」的AI學伴機器人——奇多多,成為全場焦點。這款產品在京東預售僅上線一周,銷量便突破了10000臺,這個數字不僅體現了市場對優質AI早教產品的渴望,更預示著多模態大模型在消費級硬件領域的商業化曙光正在到來。

正如一位現場寶媽所說:“太好了!終于不止是AI玩具了,而是解決了很多早教痛點問題。”在AI技術日益成熟的今天,奇多多的成功或許驗證了:在早教賽道,“功能驅動”比“概念炒作”更能讓市場買單。更令人矚目的是,奇多多在展會期間,現場獲得了上百位家長下單預定,同時吸引了幾十家AI產品后續對接無界方舟EVA模型的合作機會,成為本屆大會最具商業潛力的AI硬件產品。

云棲大會現場火爆,奇多多展現真實力

在云棲大會3號館·前沿應用館奇多多星球展臺,奇多多吸引了大量參展觀眾及寶寶駐足體驗。孩子們手拿繪本、練習、玩具、繪畫作品等,與奇多多進行自然互動,現場氣氛熱烈。

奇多多展現出的不僅僅是語音交互能力,更是真正的多模態理解能力。它能夠識別孩子手中的任意繪本/教材/卡片等讀物,無論中文、英文,甚至兒童讀物復雜分散的混合排版,都能精準識別;它能看懂孩子的現場繪畫;它能對日常物品進行即時有趣的科普,將深奧的科學原理,以孩子能夠理解的語言描述,符合孩子“邊看、邊問、邊學”的科學習得鏈路。

展會的三天時間里,奇多多展示了令人驚嘆的閱讀能力:除了所有書本都能識別外,還提供了三種閱讀模式:

朗讀模式:可識別所有類型的讀物、多種主流語言文字,語音富有表現力,避免機械感;

翻譯模式:支持多語言即時互譯,讀一句英文、翻譯一句中文,讓孩子有興趣閱讀全英文材料;

指讀模式:文字、單詞、圖案均可識別,并給出相關科普,替代傳統點讀筆、詞典筆。

“這意味著家長不再需要購買點讀筆、詞典筆、故事機等多種產品。”一位現場寶爸評價,“一機解決所有閱讀需求,能幫助孩子讀課本,和學校課業結合,這才是真正的解決剛需。”

“與傳統AI產品的交互不同,奇多多不需要按壓拍照或按壓對話,也不需要等待漫長的響應時間導致注意力轉移。”無界方舟CPO楊冬蘊(小喬)在現場介紹,“孩子們可以更自然地邊看、邊問、邊學,這是符合兒童認知行為的革命性突破。”

突破性功能:從“AI陪伴”到“功能滿足”的質變

預售破萬,奇多多究竟做對了什么?

小喬表示:“首先非常感謝廣大用戶對奇多多的喜愛和認可。奇多多的突破主要在于兩方面:一方面是回歸第一性原理,對早教產品功能做深度挖掘;另一方面是我們自研的EVA實時多模態互動模型,能真正滿足產品需求。”

從國內幾個主流電商平臺的退貨率數據可知,早教產品退貨率高達30%-70%。其中退貨率偏低的是故事機、熏聽機這類產品,AI類產品的退貨率是非常高的。所以早教硬件看似是紅海賽道,實際產品力上并沒有滿足家長和寶貝們的需求。

奇多多的突破性功能主要體現在三大方面:

1.能“看”世界的眼睛:AI識物科普與全能閱讀

無界方舟創始人&CEO曾曉東博士指出:“常見的「語音AI+CV視覺模型」在真實幼齡場景中會有四重失效,具體表現為,常見的兒童語音識別錯誤率高達52%、對任意書籍的識別準確率不足35%、對常見物品誤識率超40%、復雜概念解釋遠超認知水平。”

EVA通過“模態中樞+成長型認知引擎”架構實現突破,從“成人適配”到“兒童友好”,其中視覺能力為核心支撐:

打通視覺理解【眼】:兒童“邊看邊問”是核心交互習慣,除AI語音外,奇多多更有視覺識別能力,并帶給孩子知識科普拓展。書籍、日常物品、涂鴉作品、學校發的獎狀獎品等,這些孩子喜歡展示和提問的物件,奇多多均可識別。

除AI視覺識物和科普外,奇多多還有強大的閱讀能力,支持不同字體、多語言、全類型讀物的識別。寶貝家里的繪本、考卷、課本、期刊、卡片全能識別和閱讀,提供3種閱讀模式:朗讀、翻譯、指讀,有效替代點讀筆、詞典筆等產品。

2.堪比真人的低延遲反饋速度

革新延遲標準【快】:語音交互延遲≤250ms(匹配快速注意力轉移特性),視頻交互延遲≤400ms,書籍識別/實物識別延遲≤300ms(采用邊緣端視覺特征加速算法,支持即時反饋)。即使受限于硬件設備性能,也可以控制在秒級響應。

0-10歲兒童的注意力持續時間僅為10-30分鐘,超過1秒的響應延遲就會中斷注意力,而缺乏視覺理解的實時互動則會切斷“從看到學”的核心鏈路。很多AI語音產品采用按壓式交互,反饋在6秒以上,孩子是無法沉浸使用的。

“孩子問‘這是什么’時,如果等待超過1秒,他們的注意力就可能轉移。”小喬解釋道,“我們的技術團隊為此進行了大量優化,確保交互過程自然連貫。”

3.能“成長”的個性化陪伴感

情感與成長體系【伴】:具備48種情緒計算體系,100+種眼神表情互動,可克隆父母的音色與孩子對話。更有個性化記憶引擎帶來AI成長體驗,使每個孩子都有專屬于自己的奇多多。

奇多多是帶有成長屬性的AI產品,會隨著用戶的使用,個性化適配用戶,記得用戶的重要事件,讓每個孩子擁有屬于自己的奇多多。其背后的關鍵是“存儲型記憶 + 參數化記憶”的技術結合,為寶貝們打造專屬的 “記憶引擎”。

技術內核:EVA大模型如何突破行業瓶頸

曾曉東博士深入解析了背后的技術原理:“首先我們需要的是一個極強的實時多模態大模型來賦予硬件‘真人般的交互’,多模態模型因其能夠融合文本、圖像、音頻等多種信息形態,提供更智能、擬人化的交互,而成為重要研究方向。我們從去年年初就著重布局這個方向,在業界沒有任何現成開源方案的情況下,率先在去年8月份推出了國內SOTA的EVA端到端多模態模型,率先解決了多模態商業化致命瓶頸,為AI應用賦予了‘超級感官’與‘真大腦’,填補了走向商用落地的最后一公里。”

在此基礎上,EVA為奇多多做了兒童早教場景的深度模型適配。最特別的是看懂“萬物與書籍”的視覺魔法——AI識物科普與AI所有書全能讀。

早教場景視覺識別面臨四大核心挑戰,包括非標準書籍(多樣排版、手寫字體等)、實物形態多變、復雜環境干擾以及兒童非標準書寫和涂鴉。普通AI識別準確率低于30%,實物混淆率超45%,難以滿足兒童學習需求。

EVA針對早教場景進行了全面的場景化視覺能力優化。其“書籍全域識別引擎”支持所有類別書籍甚至手寫本,通過字體擴展、排版分析和印刷增強實現96%的準確率,并可同步語音朗讀與科普互動。在實物識別方面,采用小樣本學習技術,僅需3-5個樣本即可識別新實物,結合多模態科普和抗干擾優化,在復雜環境下仍保持93%以上準確率。針對兒童手寫和涂鴉,EVA通過專用訓練數據集和模型優化,實現94%的作業識別準確率,并能對非標準書寫保持魯棒性,還可將涂鴉關聯科普內容激發創作興趣。

個性化與隱私保護的完美平衡

在個性化方面,小喬介紹:“AI陪伴類產品,只有做好個性化成長時,才能提升使用時長和活躍度。奇多多是帶有成長屬性的AI產品,會隨著用戶的使用,個性化適配用戶,記得用戶的重要事件,讓每個孩子擁有屬于自己的奇多多。其背后的關鍵是‘存儲型記憶+參數化記憶’的技術結合,為寶貝們打造專屬的‘記憶引擎’。”

這主要依靠三個模塊協同工作:認知記憶模塊會追蹤孩子的知識軌跡,并構建認知標簽;情感記憶模塊則本地化存儲孩子的個人偏好;交互記憶模塊會依據艾賓浩斯遺忘曲線動態調整記憶內容的優先級。

針對家長關心的隱私安全問題,曾曉東博士強調:“這是我們極其重視的關鍵問題。我們通過多層技術保障、完善的家長控制功能、透明的數據承諾以及合規的設計,全面消除家長對數據隱私的顧慮。”

“我們創新性地研發PrivateLoRA技術,進一步加強兒童信息的安全與隱私保護。EVA基于PrivateLoRA構建了一套隱私優先的大模型架構,其核心思路是將涉及用戶隱私的計算任務本地化——遷移至個人終端設備執行。該技術借助低秩適配(LoRA)方法,在微調大模型時僅訓練和更新少量參數,無需原始數據上傳至云端,既降低了數據傳輸中的泄露風險,也利用本地算力實現深度個性化處理。”該技術我們已向技術社區開源(https://wanglamao.github.io/),為推動隱私保護大模型的發展貢獻力量。

開放生態:EVA OS讓每個硬件都擁有“視覺智慧大腦”

曾曉東博士分享了EVA OS的未來開放計劃:“簡單來說,EVA OS將奇多多最核心的‘眼睛’和‘大腦’做成了一個標準化、可插拔的軟硬件一體能力包,任何想做智能硬件的公司,無需從頭研發AI,直接使用我們的研發套件即可。”

EVA OS主要開放四類能力:多模態交互API、知識與視覺接口、硬件適配SDK以及廣泛的硬件兼容性。首批合作伙伴已取得顯著成效:某知名兒童出版社接入EVA書籍識別能力后,其小眾科普書的用戶閱讀時長提升3.5倍;戶外玩具廠商通過實物識別API,使望遠鏡產品增加“識別花草/鳥類”的科普功能,銷量增長52%。

未來,EVA OS致力于打造一個開放、協同的生態。不僅提供技術接口,更通過開發者社區、詳盡的文檔和技術支持,持續賦能合作伙伴,共同推動多模態AI在智能硬件領域的創新與應用。

我們希望作為先行者,讓科技平易近人,實現科技普惠、行業共榮!

責任編輯:kj005

文章投訴熱線:157 3889 8464 投訴郵箱:7983347 16@qq.com

標簽:奇多多AI

用戶名:  密碼:  沒有注冊?
網友評論:(請各位網友遵紀守法并注意語言文明,評論僅供參考不代表本站立場)