豆包开源视频天生模子VideoWorld:独创免言语模子

网页设计 [db:作者] 浏览

小编:[db:摘要]

2 月 10 日新闻,豆包年夜模子团队结合北京交通年夜学、中国迷信技巧年夜学独特开辟的视频天生试验模子“VideoWorld”本日开源。差别于 Sora 、DALL-E 、Midjourney 等主流多模态模子,VideoWorld 在业界初次实现无需依附言语模子,即可认知天下。据先容,现有模子年夜多依附言语或标签数据进修常识,很少波及纯视觉旌旗灯号的进修。但是,言语并不克不及捕获实在天下中的全部常识。比方折纸、打领结等庞杂义务,难以经由过程言语清楚表白。而 VideoWorld 去失落言语模子,实现了同一履行懂得跟推理义务。同时,它基于一种潜伏静态模子,可高效紧缩视频帧间的变更信息,明显晋升常识进修效力跟后果。在不依附任何强化进修搜寻或嘉奖函数机制条件下,VideoWorld 到达了专业 5 段 9x9 围棋程度,并可能在多种情况中,履行呆板人义务。【起源:IT之家】

当前网址:https://www.tianyuanqing.com//linggan/webdesign/390.html

 
你可能喜欢的: