■ 四川大学软件学院 陈博恒
北京时间2023年3月15日凌晨,ChatGPT的最新版本——GPT4模型正式问世。3月16日,中国版ChatGPT文心一言发布。ChatGPT是美国OpenAI研发的一款聊天机器人,其强大的功能吸引了全球成千上万人的目光,上线短短两个月的时间内,其用户量便超过了一个亿。在其刚上线不久时,绝大多数用户都是软件测试人员。这些软件测试开发者可以说是职业危机感非常强的人。许多程序员尝试用它来编写程序,而最初的尝试表明,ChatGPT的使用门槛非常高,在它实际编写出的代码中,会出现许许多多的错误,编程人员需要花费大量的时间来整合、修改代码。虽说老版本的表现并没有想象中那么惊艳,有的人认为,ChatGPT和普通的人工智能没有什么本质上的区别,只是为了博人眼球罢了,另一部分人则是看着其强大的功能,陷入沉思,自己的行业真的要被人工智能取代了吗?经过大量的测试后我们发现,ChatGPT看似能够流利、顺畅地回答我们提出的问题,但是其真实性无法得到保证,甚至会出现一些显而易见的错误,让人对它的能力表示怀疑。但是ChatGPT有着强大的学习能力,迭代速度快,从2022年11月30日第一个版本发布至今,已经更新换代了四个版本,每一次版本的更新,其功能都得到了极大的提升。或许,在不久的将来,这款聊天机器人真的能够取代某些职业。
最新版本的ChatGPT4模型和老版本相比,有了极大的提升。
首先,它可以去理解图像,并且做出逻辑推理。第三代及以前的版本只支持识别少量文字,但是从这一代开始,它已经可以识别图像,并对图像中的内容进行简单的逻辑推理。比如,上传一张气球的图片,并对它提问:“如果剪断绳子可能会发生什么?”它可以迅速做出判断,然后回复:“如果剪断绳子,气球可能会飞到天上去。”在这个案例中不难看出,ChatGPT4不仅识别出了图片中的内容,还能针对内容进行联想、推理,表现出很高的灵活性。在另一个实例中,测试者上传了一张冰箱中食物的图片,并问它:“冰箱中的食物可以做成什么菜?”它能详细地罗列出用这些食材可以做出的菜,并详细介绍冰箱中的食材。从这个案例也可以看出ChatGPT4强大的图像处理能力和逻辑联想能力。
其次,它的创作能力也得到了指数级的提升。上一代的ChatGPT只能够简单地编写小说、写文案,但是写出来的东西基本上不能直接使用,总是会出现语意不连贯、没有逻辑或者前后矛盾的情况,需要进行人工修改、润色。而现在的ChatGPT4不仅可以编写出精彩的小说,还能创作出歌曲和剧本。如果让它用26个字母从A到Z按顺序不重复地把灰姑娘的故事写出来,它能非常漂亮地写出来,非常流利,一点也不啰嗦。另外,OpenAI拿着ChatGPT去参加美国的SAT考试,也就是美国的高考,满分是1600分,他得到了1410分,这个分数达到了能上名校的优秀高中生水平,换言之,考试已经超过了90%的人类,恐怖如斯。而上一代的GhatGPT,只能考到1020分。当时的考试中,只超过了10%的人类。
最后,它的字数限制、安全性等都有很大的提升。文字输入限制提升至2.5万字,可以说,只要不是非常刁钻的需求,这个字数完全够用了。在回答问题和代码编写的准确性上,最新版本的ChatGPT也有了非常大的进步。在程序员非常关心的程序设计方面,它甚至能根据一张草图在10秒钟内就能做出一个网站,首先在纸上画出一个非常粗略的草图,拍照上传同时告诉GPT你要做的一个网站长什么样,生成网站代码,得到指令到网站做完总共历时十秒钟左右。总而言之,ChatGPT让人震撼的不是它的现有功能,而是其夸张的学习成长速度,每一代版本的性能都得到了非常大的强化,在无数的数据投喂和训练下,这种迭代速度,可能真的过不了多久,有些职业就要被取代或者重写了,甚至于整个人类社会的生产方式都可能会被改变。
在大家纷纷惊叹ChatGPT一骑绝尘的时候,百度高调宣布,文心一言——也就是中国版的ChatGPT发布!2023年3月16日14时,百度在北京总部召开新闻发布会,主题围绕文心一言,百度创始人,董事长兼首席执行官李彦宏,百度首席技术官王海峰出席。
百度早在2010年就开始布局AI了,2019年3月推出了用于知识增强的语义理解框架“文心”,并开启了模型的深度学习。如今对于百度的文心一言来讲,既是一场机遇,又是一大挑战,毕竟只有在某些方面超过ChatGPT,才能得到资本的认可。诚然,ChatGPT的技术已经处于世界领先水平,拥有非常好的发展前景,其他公司想要超越非常困难,不过现在的ChatGPT也不完美,还有许多进步空间。
相比之下,百度显然更懂中文的口号。许多用户反馈说ChatGPT中文的使用感受明显不如英文,比如在押韵上,文心一言更占优势,庞大的中文数据资源让文心一言更加适用于中文用户和需要用中文的场景。文心一言在官网上公布其模型学习了百度贴吧里面大量帖子的表达风格,让文心一言的表达更加地道,比ChatGPT更懂中国人。在ChatGPT的使用中,出现过这样的例子。用户询问ChatGPT:“出淤泥而不染,濯清涟而不妖,这句话出自哪部作品?”ChatGPT非常自信地回答:“这句话出自《红楼梦》。中国人一眼能看出有问题,但和其他答案一样,ChatGPT没有任何错误提示,甚至不会告诉用户,自己不知道或者不确定。”还有一段对话是:“《爱莲说》的作者是谁?”ChatGPT回答:“《爱莲说》的作者是白居易。”用户继续说:“错了,不是白居易。”ChatGPT就会这样说:“对不起,您是对的。《爱莲说》并不是白居易的作品。不过很抱歉我犯了这个错误。”也就是说,当前的数据量并不足以支持ChatGPT高质量地回答类似问题。
其次,百度在图像识别领域一直属于领先地位。图像可以说是事物最直接的体现,往往能够给人最直观的描述,也是现代社会生产生活中用得最多的。图像的采集通常基于纸张、图像、电视等,包括模拟和数字图像。其中,数字图像的信息量非常大,处理准确的数据信息要消耗大量的人力、物力和时间,缺乏准确性。基于此,人们引入了计算机图像处理和识别技术,该技术具有强大的存储系统,通过人类编程来实现图像评级和数据收集。文心一言的图像识别功能有强大的技术支撑,也就是说,文心一言这个聊天机器人的眼睛,可能会比ChatGPT更明亮,在视觉上的应用也许会有更好的表现。
再次,文心一言训练门槛很低,代码量很少。训练就是指在数据挖掘过程中用于训练模型的数据。文心一言的训练速度很快,不需要投喂海量的数据就可以训练出来做场景应用,而ChatGPT则需要投喂大量的数据,让其训练门槛很高。在训练过程中,较低的门槛降低了行业的应用难度,当然,实际效果如何,还需要交给时间来检验。
最后,在市场流通方面,百度专门搭建了一个AI市场。也就是说,如果训练出了一个行业模型就可以直接在这个AI市场进行交易。当然,如果不会训练的话,也可以直接购买想要的模型。目前市场里面挂的都是些智能硬件,但是一段时间后,这个AI市场可能会非常活跃。随着经济的发展,AI等技术已成为数字经济的重要基础设施,企业的数字化转型将产生对AI的更多需求,也为AI的应用提供了基础条件。随着AI技术各个细分领域的不断创新和发展,也将带来巨大的生产变化和经济增长。
进入二十一世纪,我国经济科技飞速发展,并在相应的领域内取得了一系列成就,但我们应当清醒地认识到,仍然有可能会出现被其他国家“卡脖子”的情况,而导致相关行业的发展层层受阻,影响经济社会的发展。防患于未然,我们应该自主研发国产版的“ChatGPT”。而文心一言是有自己的特点和长处的,非常契合百度的特征,也契合中国人善于商业化的特征,文心一言也不是一款应急产品,有千亿条数据量,希望百度能做出稳定好用的产品,把技术把控在中国人自己手里。