日排行周排行月排行日推荐周推荐月推荐

奇迹小说网>搞科研的学霸文>第59章 毕业论文选题

第59章 毕业论文选题(第2页)

直接提出一种全新的技术模型架构?

说实话,这个问题他想过,而且时间很久,久到可以追溯到上辈子。

虽然上辈子周昀没这么聪明,但是当他第一次接触到Transform的时候就在想,他能不能研究出一种更加厉害的基础架构。

当然了,这在上辈子完全就是幻想。

所以平时有空的时候他就会抽出时间思考这个问题,所以邱彦他们经常能看到周昀独自一个人坐在位置上发呆,而且一坐就是几个小时。

但哪怕他觉得自己现在已经足够聪明,可是经过近半年的思考,他还是没能想到什么全新的架构,终究还是被束缚在Transform的框架之下。

不过他也没有气馁,毕竟这东西要是研究出来,说一句名垂千古都不为过。

更何况他还年轻。

既然新的架构不行,就只能从他熟悉的两个领域入手了。

他的手指一顿,突然想到了一个非常好的选题,如果能做出来,贡献也绝对是巨大的。

这个选题就是——多模态融合中的最优传输理论。

多模态学习的核心是如何将不同模态(视觉、语言)的特征空间对齐,当前的方法通常使用的是交叉注意力机制,甚至是更为简单的点积或余弦相似度。

而最优传输(OptimalTransport,OT)是一种数学理论,致力于寻找将质量或概率从一种构型转移到另一种构型的最有效方式,从而最小化给定的成本。

他的想法就是将对齐问题建模为OT问题,当然,这个OT问题肯定会非常难,因为每一个特征的维度都是非常高的,而多模态的特征又非常多。

所以他就联想到了人类的大脑,人脑在处理不同感官信息(视觉、听觉、触觉)时,似乎在底层存在着一种统一的“意识流”,

各种模态的信息涌入后,被映射并在这个流中进行交换、融合和理解,比如闻着榴莲吃西瓜,就会产生一种通感。

而他要做的就是,如何将这个所谓的‘意识流’用数学的方法表现出来,他能想到的最为接近的理论就是OT理论。

至于为什么一定要将信息融合其实也很好理解,打个比方,你要向一个来自外星系、完全不懂地球文化的外星人解释什么是“苹果”,

你不能只给它看一张苹果的图片,或者只给它一个苹果吃。

因为这些信息对它来说都是割裂的、无法理解的,所以我们需要将每种信息变成一种感觉,比如苹果可能是甜的,酸的,可能是绿的,红的。。。。。。

而人在学习一个陌生的事物时候也是差不多的流程,比如神农尝百草,先了解这个草药不同的特性,然后再给它下一个定义。

同理,要让AI理解世界,这个步骤也是需要的,你得先让AI理解,苹果的一些基本特性,这也是很多大模型都在做的一个步骤。

接下来的一步便是信息融合,也就是告诉AI一个更加高级的统一语义空间,告诉它,虽然信息的模态不同,但他们描述的都是同一种东西,这就是融合的步骤。

这也是现代多模态大模型能同时处理不同模态信息的原理。

只不过在将不同模态信息纳入这个统一语义空间的语义空间时,现在的方法仍然有很多的不足。

这个问题也是真正实现AGI路上的一块绊脚石。

书友推荐:末日霸主系统麝香之梦仙子的修行无绿版Hush可怜的社畜路人被疯批男主强制爱了爱你是我们的本性仙子的修行·美人篇狂医下山,都市我为王修仙暴徒女神堕落系统仙母堕天录别让玉鼎再收徒了衔玉(古言,h,1v1)继女调教手册(H)和男学生同居的日子开局我的母亲是最大的反派(云楼记)淫悦帝王成长计划干涸地今天的圣女大人也在努力生产「圣水」
书友收藏:冷艳美母是我的丝袜性奴崩坏:星穹铁道从纲手大人开始,将木叶的忍者们都催眠改造成忠于吾等胯下的肥奶肉臀の弱智母猪!崩坏:性穹铁道我破了妈妈的女儿身世界调制模式之原神版崩坏淫萝妓院不喜欢cos的妈妈被我催眠成cosreRBQ美母为妻末日霸主系统原神的女角色们总会向旅行者露出小穴的,对吗爱你老妈混在女帝身边的假太监韵母攻略黑人全家桶(去黑、去绿改)旅行者的束缚之路幸福全家桶!国色天香的蠢萌妹妹,性感迷人的尤物姑姑,冷艳无双的妩媚妈妈全都是我的肉便器!都市:我成了富二代反派(六改版)母姐攻略我超绝可爱白胖雌肉飞机杯似的双胞胎萝莉白丝女儿,绝不可能在我不知道的情况下被NTR隐奸寝取