有道上线翻译大模型,CEO 称已经赶超 ChatGPT
有道上线翻译大模型,CEO 称已经赶超 ChatGPT
图片来源:视觉中国
ChatGPT 出现之后,网易有道公司内部大吵了一架。
吵架的话题导火索是,有道翻译这款产品的下一步该如何走。这款产品在 2008 年上线,是网易自主研发的,也是国内首家统计机器翻译线上引擎。
经过 15 年的技术迭代,有道神经网络翻译(NMT)在行业内占据优势地位。第三方平台的数据显示,到目前为止,有道词典月活用户已经超过 1 亿,是国内词典翻译市场的第一名。
通常而言,做翻译相关产品,业内的共识追求是,它能不能替代人工翻译。一定程度上,现有的翻译产品,已经实现了这一目标。
目标实现了,然后呢?这之后,应该怎么办?换句话说,一项技术一旦超越了传统能力,甚至超过人类智力表现之后,最大的改变应该是什么?
网易有道 CEO 周枫想明白了,前沿技术已经在更新,翻译再这样做下去不行,必须要迭代。他想用大模型的方式,重新思考翻译这款产品的逻辑。
最大的改变,应该是让翻译产品的使用量大幅上升,就像福特做出了 ModelT 这款改写全球汽车产业发展的汽车。ModelT 的价格让普通人都负担得起,汽车变成所有人都可以用,这个时候,技术就真的改变世界了。
周枫告诉钛媒体 APP,这些争吵在注重技术的网易有道属于常态,他们内部也经常做这样的事情。
他认为,技术团队时常需要转换脑筋。于是,他把翻译团队这帮老同事再度聚集起来,让大家学习大语言模型的能力,试图把翻译这款产品在新的模型上跑起来。
大约过了四五个月之后,团队评测后发现,这些工作是有效的,现有模型的性能和最后翻译的质量,已经超过之前用的模型了。
但投入 " 烧钱 " 的大模型,对于尚处于盈利阶段挣扎的网易公司来说,是否划算?公司研发和训练大模型的成本投入,又是否感到吃力?
今年第一季度,网易有道业绩产生波动。财报数据显示,一季度,网易有道净收入为 11.6 亿元人民币,同比减少 3.1%;净亏损 2.1 亿元,同比增加 101.9%,继上个季度利润转正后再次由盈转亏;并且,有道一直引以为傲的硬件业务收入也下滑 16%。
" 做公司永远是这样的,好东西都要钱,好的也最贵,这不是新问题,我们一定会管理好。" 周枫对钛媒体 APP 表示。
他称,现在做大模型效率还比较高,一方面是公司之前有一定的基础,另一方面,有道 Transformer 的优化很强,很早的时候,他们就能把 Transformer 装到小设备里面。
并且,大模型的边际成本非常低,复制模型不需要太多额外的成本。虽然有道的近百人的 AI 团队,人数也不少,但总体上,不需要增加额外的特别大的投入。
在网易有道首席科学家段亦涛看来,很多技术和资源都是一脉相承的。他告诉钛媒体 APP,有道做大模型的过程,是在之前团队框架进行的,并没有额外的组建团队来做。
从 2016 年开始,有道协同构建 AI 基础能力,同步组建语言、视觉、声音等团队,积累了有道神经网络翻译(NMT)、计算机视觉、智能语音 AI 技术、高性能计算 ( HPC)四个底层技术能力。
2017 年,有道就看上了主流技术 Transformer,将 AI 能力统一在大模型之下,重视在端侧的落地应用。2019 年,有道词典笔 2 代的产品中,首次搭载离线 Transformer NMT。2022 年,有道词典笔 P5 中搭载了自研的离线 ASR,已升级为 Transformer 技术。
用大模型做翻译产品,周枫公开表示,在内部的测试中,在中英互译的方向上,已经超越 ChatGPT 的翻译能力,也超过了谷歌翻译的水准。
不过,基于大模型的翻译产品,一个非常现实的问题是,它的成本较之前是有所提升的。周枫对钛媒体 APP 透露,内部经过测算,用大模型做翻译,因为计算量非常大,查询一次的成本,要比之前的模型贵近 20 倍,而有道的翻译产品,现在每天大约要承接几亿次的查询量。
虽然让大模型翻译大量被使用是周枫的目标,但他也发现,大模型的确是烧钱,尤其是在最开始的时候,会有一些成本上的困难。他们目前需要资金,因为确实现有的东西,不满足他们对产品的要求。
这样的投入吃紧的现实,也可能改变翻译这类产品的商业模式。不同于以往翻译产品的流量转化广告变现的逻辑,周枫告诉钛媒体 APP,对大模型翻译来说,付费会员制是目前比较合理的方案。
不过,大模型也已经引来教育界的 " 封杀 "。美国多所公立学校已经禁用了 ChatGPT, 多家科学期刊也禁止将 ChatGPT 列为论文 " 合著者 "。
周枫也反对学生在学习的过程中用大模型 " 抄答案 " 的行为,在应用端体现为 " 家长管控 " 功能,可以管控识别答案,给出讲解,而不是直接给出最后的答案。
不用去把大模型去神圣化。周枫说,我们应当对大模型里面的产品和技术创新做到具体案例具体分析,不能认为大模型是一切事物的通途,更值得研究的是,在丰富的应用场景。应用和场景是整个变革的过程中,大家应该及早去抓的。因为抓得越早,后边能抓到的东西越多。
不只是网易有道,教育界也有一些公司对大模型的积极拥抱。今年 5 月,学而思正在研发数学大模型 MathGPT 的消息引发行业热议。
彼时,学而思方面对钛媒体 APP 表示,MathGPT 以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。
今年 7 月初,学而思一次发布会上透露可能该月底会有相关成果的对外展示。不过,截至目前,他们还没有相关进展对外披露。
这背后或许是相对于其他领域,数学大模型难度颇高。
数学大模型要解决的三个难题在于,第一,题目要解对,现在 GPT 结果经常出现错误;第二,解题步骤要稳定、清晰,现在 GPT 的解题步骤每次都不一样,而且生成内容经常很冗余;第三,解题要讲得有趣、个性化,现在 GPT 的解释过于 " 学术 " 和机械,对孩子的学习体验很不友好。
周枫则认为,数学大模型是大家都想投入的方向,但只是给数学大模型 " 投喂 " 再多的内容,都不适用于数学领域,它背后涉及的是一些数学原理性的问题,现在的大模型还不具备这样的能力,但这仍是一个值得研究的方向。
钛媒体 APP 了解到,新东方、作业帮等教培巨头内部,也已经把目光盯紧大模型,但目前暂未有公开落地的成果。
(本文首发钛媒体 APP,作者|李程程)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App
-
- 违规使用医保基金,“常德首富”旗下公司 25 亿元可转债发行受阻,市值单日蒸
-
2023-08-10 06:37:08
-
- 马化腾“掘金”房地产
-
2023-08-10 06:34:52
-
- 海底捞“晴了”
-
2023-08-10 06:32:36
-
- 暑期电影大卖 银行 APP 购票“羊毛”多
-
2023-08-10 06:30:20
-
- 太火爆!涨疯了!网友吐槽:月薪 2 万都住不起
-
2023-08-10 06:28:04
-
- 天天 9.9 活动下线,库迪卷不动了?
-
2023-08-10 06:25:48
-
- 功成拂衣去,中国智驾顶尖人才开始反哺英伟达了
-
2023-08-10 06:23:32
-
- 抚顺市回应6岁女童被虐案(6月被虐女童案被告人将从重从快严惩)
-
2023-08-09 15:28:46
-
- 广州20个景点免费(市内20个免费景点)
-
2023-08-09 15:26:29
-
- 13年英菲尼迪qx56市场价(高价买辆英菲尼迪QX56)
-
2023-08-09 15:24:13
-
- 去阿拉善旅游(一定要玩的10个地方)
-
2023-08-09 15:21:56
-
- 广东连南千年瑶寨旅游村(世界过山瑶之乡乳源)
-
2023-08-09 15:19:40
-
- 阳谷县乡镇排名(山东省聊城市阳谷县乡镇及村名汇总)
-
2023-08-09 15:17:24
-
- 俞敏洪应该学拼多多
-
2023-08-09 15:15:07
-
- 上海最出名贵族私立学校(上海顶尖民办里的便宜学校)
-
2023-08-09 15:12:51
-
- 云南旅游攻略六天五晚1280元(淡季游云南1500元人)
-
2023-08-09 15:10:34
-
- 武汉日记的感悟(武汉日记第1-4篇)
-
2023-08-09 15:08:18
-
- 北京现代新悦动汽车(北京现代全新悦动)
-
2023-08-08 18:40:10
-
- 广州中谷海运集团官网(中谷海运布局绿色新赛道)
-
2023-08-08 18:37:54
-
- 东方卫视主持人翻车事件详情(上海五位主持人经历疾病)
-
2023-08-08 18:35:38