按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
所以其实具象去看,它就变成了一个射击游戏,你不断地给机器喂数据,让它学着怎么去命中靶心。一旦它学会了,那换了另一个靶子,它大概也能做到差不多的水平。
当然,再具体去说,数据很复杂,情况也多变。这里我们就不细致探讨。”
路舟也同样在台下,也就当学习一般听着,毕竟陆铭所讲也算有趣。
陆铭,“其实,你再反向去看这个射击的场景也会很有意思。如果是人去学习射击该是怎么样的过程?首先大脑传达信号,然后手指的肌肉产生反应,进行射击后我们通过眼睛去识别到底打中没有。
而机器呢,它没有这些东西,所以我们给它一个输入输出函数,输入到机器,它就出来反应,然后它再根据loss识别到底命中没有。
那都打不中怎么办,那就学到会为止。而事实上,这就是我们常说的人工智能,其实它就是用数学来模拟我们的生物特征。尽管实际应用中,它和统计更加相关。”
在和陆铭确定了接下来一些微讯的系统研究课题后,路舟也就驱车准备回公司。
临走之前,路舟却是在陆铭的讲解中突然就冒出了个脑洞来。
路舟对陆铭问道,“师兄,刚刚你说的射击场景还记得吧。”
陆铭点头,“嗯。怎么,有什么问题?”
路舟,“问题是没有。我就在想,你刚整个过程不是一个简化和比喻吗?”
“对,算是个比喻。”
路舟,“那么,复杂化的情况你觉得怎么样?”
陆铭听了一脸好奇,“嗯?”
路舟说道,“ai和正常编程处理数据的区别,一般我们也都说,是否需要显式编程。”
陆铭点头,“嗯。”
路舟摩挲着下巴,“那么我要是给一台机器装上移动的手臂,再接着给它装上摄像头和传感器。那么,这个射击的学习过程是否真的成立。
嗯。我是指一次编程定义,最后机器真的学习了射击这个动作。”
陆铭,“这个似乎有些不大不要,真的就是一个例子。”
路舟摇头,显然陆铭是没有理解他的意思。
“那这样,这个机器的身体我做得足够复杂。我也不进行显式编程来定义它的动作,而仅仅是在隐式的神经网络中定义好传感器的参数。
只要机器身体结构足够优秀,它是否有可能出现真正的学习,比如,从零开始蹒跚学步,学习奔跑跳跃,甚至投篮打羽毛球。”
陆铭这算是听懂了路舟的话,“理论上推动n训练确实可行,但现时命中率是个问题。on的话。”
路舟也没有理会陆铭,却是继续说了下去,“不不师兄,我是在说真正的人。”
“单单身体也许你还很难理解,那如果是增加听觉传感,然后再给予它一个喇叭呢?”
陆铭乐得,他笑了笑,“所以你要让它学习语言?这也算是个很好的课题吧,尽管很困难。”
路舟依旧摇头,“不不。你回想一下,人从婴儿开始学走路学说话,再到成人形成世界观,这一整个过程!我的意思是创造一台机器去经历这个过程,并且尽量减少显式编程的干预。”
陆铭恍然大悟,“很有意思。也许这真的会成为一种新人类。”
路舟伸出手指示意稍等,他陷入了一阵深思之中。
“还是刚刚的场景,假设我已经创造出了这样两台机器。他们拥有一切和人类类似的身体结构,可以发声音,能够接收五感。
但我们仅仅定义隐式的神经网络给它们。而一开始它们也不会拥有任何关于这个世界的信息。”
路舟斟酌了一下语言,“ok。现在它们其中一台开机,接触了整个世界,感受到光线、温度甚至空气。
这会,刚好我的手机响了,发出了‘lg’的一声。很好,它接收了这个音符,图像识别出了这台手机。
第二台机器开机,开始如同刚刚那台一样,对,就和婴儿认知这个世界一样。但这时,如果第一台用发声器发出了‘lg’的一声,然后它抬起手指向手机。
一遍,两遍第二台机器终于‘明白’了意思,也发出了lg一声而后指着那台手机。”
陆铭听到这,脑子一下炸响。他想到了一个场景某个普通的家庭中,妈妈抱着一个婴儿,嘴里说着“爸爸”,然后一边指向一个男人。
“你想说,最后这两台机器间通过交流可以认识整个世界,甚至产生自己的语言,乃至于产生意识?又或者你想表达,真正的人工智能需要一副和人类类似的躯体才能实现对世界产生真正所谓想法?”
路舟笑了笑,“我想,按照这个思路,我们应该将它们变成一个群体,就像人类一样群聚生活,这样它们历史进程应该会天翻地覆。对,通过它们自己的认识去推进它们的历史。”
陆铭听到这,愈发有些细思极恐。对,路舟所说的每一样都可以找到大量相关的理论支撑,唯一的问题就是更优化的理论以及实现的困难。
陆铭笑着摇头,“尽管这是个有趣的课题,但我想需要的时间有些长。也许是数十年上百年。”
路舟笑道,“乐意奉陪。”
陆铭拍了拍路舟的肩膀,“先这样吧。畅想未来,着眼眼前。”
路舟,“好。那我就先回去了。这个想法我之后整理一下。就当个业余课题吧。”
陆铭,“行。”
路舟这也就走出了实验楼,而脑子里也在思考着问题。
语言到底是什么?而意识又该是什么?
。
243。数据工厂
路舟走后,陆铭回到了实验室内。全本小说网https://。
他一边走到后排,吩咐助手将新买的显卡拆出来安装。x280,而大多则是微讯的员工送过来的英伟达最新型号gtx580。
去年daniresan发表的论文堪称震惊世人。x280来处理数层的神经网络。而在此之前,神经网络的发展是一直苦于cpu的处理速度限制,而即便是要使用gpu,也得为特定的问题制作特定的算法。
而说来让陆铭觉得巧的是,路舟年前给他提这事还让他颇为头疼。但就仅仅几天前,daniresan新发布的论文提供了一种快速、可参数化的卷积神经网络,这可当真是瞌睡了来枕头。
当然,对陆铭来讲麻烦事自然也有,比如数据集的问题、实习生的水平问题、最终实际应用的问题。
而这些都得靠时间一点点解决。
陆铭想了想就笑了起来,他是没多大心态变化,反而是更加期待这接下来的工作。
反正天大的事也不是他陆铭顶着,这背靠着小学弟他也就安心研究便是。
两周后,梦谷云低调上线了众包平台。
大多数关注到消息的网民第一反应,“?!”
尽管众包的模式并不算新鲜,但让人感到新鲜的在于众包中的项目。
梦谷众包分了数个栏目语音转文字、图片转文字、图片标注和分类、脸部照片和视频、脚部照片等。
前头两项按照提交的量计费,而后两项则是一次计费。
有眼尖的互联网从业者这就认出了这梦谷众包模仿的是亚马逊众包。须知,著名的iage中就有大量来自亚马逊众包的数据集。
梦谷云这是要搞事情啊?有没这么牛逼?
当然,外头怎么猜怎么想是别人的事情。
一周后。
此时的路舟正在前往郑市的飞机上。说来,这是他第一次去这城市。
路舟身边是坐了梦谷推广广南分公司的经理周凯。身后的周达和王强东倒不是必要来的,不过是和周凯相熟一起合作所以也是跟了过来。
事情的倒也简单,无非还是ai那点事,需要一些下游的公司来处理一些业务。
在陆铭的实验室研究项目开始运转后,路舟先是安排了微讯向海天瑞声购买了一批语音库供陆铭研究使用。
海天瑞声是早在98年开始就做着语音标注的业务。路舟所买下的语音数据库,里头的结构可以看成是一段语音对应一段文字。这样的库被广泛地用于训练ai,做语音识别或者转换等领域。
至于这些库的源头?那自然是人工听取再标注出文字数据。
而有语音标注,自然就也有图片、视频。这些都被称为数据标注。一个神经网络搭建后,需要用到的训练数据便大多是来自于这里头。
梦谷云上线众包或者路舟这次来郑市的目的也在于此,找人,认数据,练ai。
至于裨益,那简直是全方位的。几乎所有梦谷内的产品都能有所获益。
“周凯。”
“老板请讲。”
路舟摆了摆手,“叫我路舟吧还是。说说,你是怎么就这么大胆公司刚上众包一个月,你这就敢拉起工作室来搞的?”
周凯笑道,“那是老板一直赏饭吃。作为公司一员,我可得时刻关注公司的产品状况。这不众包一上,我和他俩一合计觉得可以弄,这就直接安排了搞。
咱这省是华夏人也知道,人多嘿嘿,自然招工成本也是低的。”
路舟点头,“那你们三人执行力也算挺强。”
周凯说道,“其实乡里本就有做这行的,有所见闻我这上手也快。”
随后路舟也不多问,毕竟具体还是要看了才知道状况。
这数据标注的事情,说来是简单,像周凯这样无非就是找几个能用电脑的就可以开始做。但往深了讲,它也得有些注意。
好比人脸照片和视频,又或者是微讯内一些语音的元数据,这多少都会涉及一些和敏感。
若是周凯能做得来,管理得当,路舟自然不介意整体划出部分给周凯做。而若是不能,那路舟也省得回头出问题惹一身骚。
当然,这少不得还得专门开发些特定的系统给标注员使用。真考究起来也麻烦。找外包自然是可以,但这类事能抓在自己子公司下就还是抓的好,路舟也就趁着走一趟。
等到飞机抵达郑市,出了机场周凯是直接打了的士往目的地去。
不一会,周凯,“到了路总。这是新市边上的一园区。”
路舟下车一瞧,似还不错,最起码不是自己想象中的那种小作坊地头。
周凯一边走在跟前接引,一边说道,“这是同乡另一个搞标注的老乡介绍。这两栋办公楼内是有不少从事相关数据业务的公司。”
路舟点头,“比如?”
周凯笑笑,“多了我也不清楚,毕竟深了不熟不好过问。不过我那老乡最近是在做的苹果希瑞的数据单。”
路舟,“哦?”
看来这说的应该是苹果siri的中文数据标注,路舟想。
虽然眼下苹果应该还没有发布,但相关的数据应该是一直在做,系统也在一直训练。
至于凭甚能流到周凯老乡这?
那大抵是华夏人才能听懂认出中文,而这郑市的用工成本也低廉。
当然,路舟也觉得周凯老乡所做,说不准是层层转包之后才流入到这园区里头。
尽管听着别样怪异,但路舟想来也是这样的可能性更高。“数据黄牛”嘛,不挺正常。自己做便是尽量杜绝便好。
走进了办公楼,四人上了电梯后便来到了其中一间。