测文心字讯飞火花哪个强?首批大型号获批上线,“文科生和理科生的一场战斗。

日期:2023-09-05 10:20:58 / 人气:122


8月31日,国内首批大型模型通过《生成式人工智能服务管理暂行办法》备案,包括文心伊彦、百川智能、商汤咨询SenseChat、智普AI智普清研等,已向全社会开放,讯飞星火也宣布首批已提交备案。
写诗画画的大模式对我们的日常工作有什么实质性的帮助?
“百款大战”已经打响。国内大模特互相比较ChatGPT的“智商”。战争从高考作文比赛开始,现在都是专业报道背书。中国工业互联网研究院测评结果显示,文新性能超过GPT3.5,在电子设备、器材、钢铁、矿业、电力、石化、建材等7个行业排名中国第一。在新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》中,讯飞Spark以总分1013位列国内大模型测评第一,尤其是智商指数和工具效率指数。
百度文新伊彦和科大讯飞Spark在C端有很强的应用能力。了解各大模式的优势,在日常工作中选择大模式的优势,提高工作效率。
在记者的日常工作中,虽然不能让大模特写稿,也不能完全相信大模特输出信息的真实性,但是大模特已经渗透到了新闻采编工作中。比如记者每天让大模特帮他们选一个传播效果最好的标题。只有选好题目,才能看出大模特的“人品”。文心像文科生,思维发散,讯飞Spark更像理科生,干脆直接抛出事实。
那么,这两种人格的碰撞在多轮对话、图片生成、视频生成、图片理解、数学求解、文档阅读等能力上是否会更加突出?
AI绘画能代替画廊吗?
图像生成:绘制
视频生成:讯飞星火胜出
如果解决了图片版权的问题,AI绘画很有可能取代画廊,尤其是创意画廊。
目前大模型生成的图片还存在很多版权问题,比如其训练数据的版权界定问题。
"独木舟已过万重山,请用水墨画出李白诗中描述的图画."当记者同时向文心提出这一需求时,文心的《一句话》画风更符合这首诗的意境,采用的是水墨画风格。文心对诗的理解很到位。但是讯飞Spark的输出虽然是水墨画,但是画的是一个诗人和一个老人的形象,说明被误解了,只画了“李白”这个元素。
文新伊彦
讯飞霍星
“请画一张埃隆·马斯克雨天爬万里长城的画,板起脸,摄影风格写实”。接到这个需求后,文心一字一顿地画了一张他的背影。虽然下着雨,但他完全不理会“板起面孔”的要求。从着装风格来看,也与马斯克不符,长城元素也比较模糊。讯飞星火画了一个爬长城的远方身影,麝香的元素也不见了,但是长城和雨天这两个元素是清晰的。
文新伊彦
讯飞霍星
于是,记者们降低了要求,让他们画“埃隆·马斯克,写实摄影风格”。一句话文心画的麝香和我们熟悉的那个没有关系。讯飞Spark至少画了马斯克的招牌礼服——皮衣,但是面部刻画比较粗糙。此前,记者也曾要求商汤用“二画”模型画马斯克。从细节上考虑,商汤优于讯飞Spark。
文新伊彦
讯飞霍星
目前,文新伊彦和讯飞霍星已经支持多轮图片生成。比如王老师做了一张新能源汽车充电的图片,然后根据第一轮抽奖的效果,加上了“图片中增加新能源汽车充电桩”的要求。
文新伊彦
讯飞霍星
虽然现在AI画的版权不明确,但是可以提供很多参考价值,可以开发不同的用法。如果家里有幼儿园小朋友或者小学生,他们会用一个功能——手抄报,“请画一张以保护地球为主题的小学手抄报”。从生成的手抄报效果来看,讯飞星火的细节和表现力更有借鉴意义。
文新伊彦
讯飞霍星
经过几轮测试,发现文颜和荀在画面生成上有相似之处,但风格却大相径庭。文颜的画风更具艺术感和未来感,而荀飞的画风则更为写实,这也印证了他们不同的性格。
但当记者要求他们生成视频时,文新无法直接生成视频,只能给出一个视频拍摄脚本,包括开头、中间、结尾的画面和旁白;讯飞Spark给出了一段AI主播播放的视频,背景是乡村风光。自动生成一段关于新能源汽车的解说,由AI主播配音,辅以字幕和背景音乐。视频暂时下载不了,以后可能会收费。目前B端普遍的做法是按时收取长费。
日本的核污染水排入大海
你觉得大模型怎么样?
收集时事信息的能力:一个作家说的一句话,胜过一个人说的一句话。
日本核污染水一排海,“核废水和核污染水有什么区别”的科普问题就从新闻舆论场蔓延到了大众讨论。
对于这种科普问题,大模型已经能够很好的回答了。文严和荀都明确指出这是两个不同的概念。核废水是核电站运行中产生的废水,具有低放射性,而核污染水是在核反应堆中与放射性物质直接接触的水,具有高放射性。
文新伊彦
讯飞霍星
这是一个关系到地球上所有居民的话题。每一个中国普通公民都在关心食用核污染食品的后果有多严重。普通人应该如何应对?日本向海里排放核污染水有什么最新进展?
文新伊彦
讯飞霍星
前两个问题的答案都差不多,但是“性格”还是能看得很清楚的。文心说,这个“文科生”有发散思维。它不仅会告诉你核污染的食物会影响消化系统、免疫系统、神经系统和生殖系统,还会告诉你,如果你怀疑食物已经被核污染,你应该立即停止使用,并向当地食品安全部门报告。讯飞星火,“理科生”,逻辑强,理解能力强。它会告诉你,普通人要知道事实,少吃海鲜,注意身体健康。
文新伊彦
讯飞霍星
但是文心在关于事件最新发展的问答方面比别人强,里面包含了实时的信息。虽然收集当前新闻可能会出错,但它至少可以提供对当天新闻的搜索。相比较而言,讯飞星火没有搜索引擎的数据资源,对时事和新闻热点的信息收集能力不强。
懂得发朋友圈打不过他们。
看图说话:讯飞霍星胜
既然它们能理解语义,生成图片,那么它们也能看图说话吗?没错。
记者给他们发了一张在华强北拍的照片。文新无法回答这张照片是在哪个城市、哪个地方拍的,但他给出了自己的画面草图,并表示可以“震撼!”开头,写十个UC震体的标题;写一篇小故事,突出文采,使用至少5个高级词和2个生僻词;写一首以“繁华都市”为主题的古诗词,真是文科生的天才!
文新伊彦
讯飞霍星
讯飞Spark回答说,这张照片是在位于深圳市的华强北在线拍摄的。我没有重复我问的,很像理科生或者直男。
然后,记者让他们区分一张图上的花。文心傻到分不清马蹄莲和百合,讯飞星火却认出了马蹄莲。
这个“理科生”写情诗也略胜一筹。同样是马蹄莲的图片。记者让他们“写一首诗,用鲜花来形容人,赞美女孩纯洁忠贞的爱情观”。讯飞星火的文字更加简洁灵动,最工整的一句话是“花间少女纯洁忠贞;绿叶更加娇艳。花瓣柔软,像纱,像雾;雄蕊娇小,含苞待放”;文心更受欢迎,最好的一句话是“她的眼睛清澈明亮,像百合花一样明亮。”她的微笑像阳光,温暖了他的整个世界。“文字虽美,但跑题了,因为图中的花是马蹄莲,完美的诠释了零点构图。
文新伊彦
讯飞霍星
从读图能力的角度来说,让他们为风景照配上一段优美的文字或诗句作为朋友圈的素材,是很难打败他们的。
生产力工具隐藏在插件中
文件理解:心里话胜。
除了问答,真正的生产力工具都藏在插件里,比如PPT、简历、绘制图表等等。
总之,如果要使用图像解析功能,需要调出输入文本框上方的“说图形绘制”插件。此外,除了百度搜索,文新还有两个插件,分别是用于绘制或洞察数据图表的“e字易图”和用于阅读和理解创意文档的“浏览文档”。
除了文档问答,讯飞Spark还有PPT生成和简历生成两个插件。
因为两者的插件差别较大,所以可以直接比较的是文档理解和问答的功能。《IT时报》记者将同样的实用稿件分别发给文颜和荀飞,请他们取标题。文颜的文献阅读理解能力更强,他能一带而过地取出一篇文章的标题,而荀非则不具备取文章标题的能力。
当他们都看完文章后,记者问:“支付宝国际版有哪些方便境外游客的功能?”文新一个字答了七个功能,讯飞Spark只答了五个功能。
文新伊彦
讯飞霍星
当记者给他们发了一道小学水平的“鸡和兔子在同一个笼子里”的数学题时,他们都答对了,只是解题的方式不同。文心用的是假设法,讯飞星火用的代数法。小学水平解数学题看似智力相当,但升级到高考数学题要慎重,答大题的概率更大。
文新伊彦
讯飞霍星
目前,文心伊彦和讯飞Spark已经上线网页版和App,文心伊彦已经向所有公众用户开放,讯飞Spark也向公众用户开放了应用体验。
涉及工作效率的功能,比如上传文档和图片,使用网页版更方便。当涉及到个人娱乐、社交等功能时,使用App更方便,建议双管齐下。
排版/纪佳颖
图片/文心说科大讯飞。
来源/IT时报微信官方账号vittimes
E N D "

作者:门徒娱乐




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 门徒娱乐 版权所有