去可网 > 社会 > 正文

有道上线翻译大模型，CEO 称已经赶超 ChatGPT

2023-08-10 06:39 来源：去可网点击：101

有道上线翻译大模型，CEO 称已经赶超 ChatGPT

图片来源：视觉中国

ChatGPT 出现之后，网易有道公司内部大吵了一架。

吵架的话题导火索是，有道翻译这款产品的下一步该如何走。这款产品在 2008 年上线，是网易自主研发的，也是国内首家统计机器翻译线上引擎。

经过 15 年的技术迭代，有道神经网络翻译（NMT）在行业内占据优势地位。第三方平台的数据显示，到目前为止，有道词典月活用户已经超过 1 亿，是国内词典翻译市场的第一名。

通常而言，做翻译相关产品，业内的共识追求是，它能不能替代人工翻译。一定程度上，现有的翻译产品，已经实现了这一目标。

目标实现了，然后呢？这之后，应该怎么办？换句话说，一项技术一旦超越了传统能力，甚至超过人类智力表现之后，最大的改变应该是什么？

网易有道 CEO 周枫想明白了，前沿技术已经在更新，翻译再这样做下去不行，必须要迭代。他想用大模型的方式，重新思考翻译这款产品的逻辑。

最大的改变，应该是让翻译产品的使用量大幅上升，就像福特做出了 ModelT 这款改写全球汽车产业发展的汽车。ModelT 的价格让普通人都负担得起，汽车变成所有人都可以用，这个时候，技术就真的改变世界了。

周枫告诉钛媒体 APP，这些争吵在注重技术的网易有道属于常态，他们内部也经常做这样的事情。

他认为，技术团队时常需要转换脑筋。于是，他把翻译团队这帮老同事再度聚集起来，让大家学习大语言模型的能力，试图把翻译这款产品在新的模型上跑起来。

大约过了四五个月之后，团队评测后发现，这些工作是有效的，现有模型的性能和最后翻译的质量，已经超过之前用的模型了。

但投入 " 烧钱 " 的大模型，对于尚处于盈利阶段挣扎的网易公司来说，是否划算？公司研发和训练大模型的成本投入，又是否感到吃力？

今年第一季度，网易有道业绩产生波动。财报数据显示，一季度，网易有道净收入为 11.6 亿元人民币，同比减少 3.1%；净亏损 2.1 亿元，同比增加 101.9%，继上个季度利润转正后再次由盈转亏；并且，有道一直引以为傲的硬件业务收入也下滑 16%。

" 做公司永远是这样的，好东西都要钱，好的也最贵，这不是新问题，我们一定会管理好。" 周枫对钛媒体 APP 表示。

他称，现在做大模型效率还比较高，一方面是公司之前有一定的基础，另一方面，有道 Transformer 的优化很强，很早的时候，他们就能把 Transformer 装到小设备里面。

并且，大模型的边际成本非常低，复制模型不需要太多额外的成本。虽然有道的近百人的 AI 团队，人数也不少，但总体上，不需要增加额外的特别大的投入。

在网易有道首席科学家段亦涛看来，很多技术和资源都是一脉相承的。他告诉钛媒体 APP，有道做大模型的过程，是在之前团队框架进行的，并没有额外的组建团队来做。

从 2016 年开始，有道协同构建 AI 基础能力，同步组建语言、视觉、声音等团队，积累了有道神经网络翻译（NMT）、计算机视觉、智能语音 AI 技术、高性能计算 ( HPC）四个底层技术能力。

2017 年，有道就看上了主流技术 Transformer，将 AI 能力统一在大模型之下，重视在端侧的落地应用。2019 年，有道词典笔 2 代的产品中，首次搭载离线 Transformer NMT。2022 年，有道词典笔 P5 中搭载了自研的离线 ASR，已升级为 Transformer 技术。

用大模型做翻译产品，周枫公开表示，在内部的测试中，在中英互译的方向上，已经超越 ChatGPT 的翻译能力，也超过了谷歌翻译的水准。

不过，基于大模型的翻译产品，一个非常现实的问题是，它的成本较之前是有所提升的。周枫对钛媒体 APP 透露，内部经过测算，用大模型做翻译，因为计算量非常大，查询一次的成本，要比之前的模型贵近 20 倍，而有道的翻译产品，现在每天大约要承接几亿次的查询量。

虽然让大模型翻译大量被使用是周枫的目标，但他也发现，大模型的确是烧钱，尤其是在最开始的时候，会有一些成本上的困难。他们目前需要资金，因为确实现有的东西，不满足他们对产品的要求。

这样的投入吃紧的现实，也可能改变翻译这类产品的商业模式。不同于以往翻译产品的流量转化广告变现的逻辑，周枫告诉钛媒体 APP，对大模型翻译来说，付费会员制是目前比较合理的方案。

不过，大模型也已经引来教育界的 " 封杀 "。美国多所公立学校已经禁用了 ChatGPT, 多家科学期刊也禁止将 ChatGPT 列为论文 " 合著者 "。

周枫也反对学生在学习的过程中用大模型 " 抄答案 " 的行为，在应用端体现为 " 家长管控 " 功能，可以管控识别答案，给出讲解，而不是直接给出最后的答案。

不用去把大模型去神圣化。周枫说，我们应当对大模型里面的产品和技术创新做到具体案例具体分析，不能认为大模型是一切事物的通途，更值得研究的是，在丰富的应用场景。应用和场景是整个变革的过程中，大家应该及早去抓的。因为抓得越早，后边能抓到的东西越多。

不只是网易有道，教育界也有一些公司对大模型的积极拥抱。今年 5 月，学而思正在研发数学大模型 MathGPT 的消息引发行业热议。

彼时，学而思方面对钛媒体 APP 表示，MathGPT 以数学领域的解题和讲题算法为核心，目前已经取得阶段性成果，并将于年内推出基于该自研大模型的产品级应用。

今年 7 月初，学而思一次发布会上透露可能该月底会有相关成果的对外展示。不过，截至目前，他们还没有相关进展对外披露。

这背后或许是相对于其他领域，数学大模型难度颇高。

数学大模型要解决的三个难题在于，第一，题目要解对，现在 GPT 结果经常出现错误；第二，解题步骤要稳定、清晰，现在 GPT 的解题步骤每次都不一样，而且生成内容经常很冗余；第三，解题要讲得有趣、个性化，现在 GPT 的解释过于 " 学术 " 和机械，对孩子的学习体验很不友好。

周枫则认为，数学大模型是大家都想投入的方向，但只是给数学大模型 " 投喂 " 再多的内容，都不适用于数学领域，它背后涉及的是一些数学原理性的问题，现在的大模型还不具备这样的能力，但这仍是一个值得研究的方向。

钛媒体 APP 了解到，新东方、作业帮等教培巨头内部，也已经把目光盯紧大模型，但目前暂未有公开落地的成果。

（本文首发钛媒体 APP，作者｜李程程）

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体 App

​有道上线翻译大模型，CEO 称已经赶超 ChatGPT

有道上线翻译大模型，CEO 称已经赶超 ChatGPT