Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 3|回復: 0

带有文本覆盖的翻译错误的

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2025-3-5 12:06:32 | 顯示全部樓層 |閱讀模式
使用大型语言模型来处理翻译任务已经相当有效,但在小红书这样内容丰富的社交平台上,仍然存在不少挑战。

语言的多样性是最难的。一些文化特定的术语、惯用表达或隐喻,如习语和俚语,很难准确翻译。

还有一些名称和昵称,模型可能无法很好地区分哪些需要翻译,哪些应该保持不变。

例如,“orange man”被直接译为“橙人”,但实际上指的是特朗普。

除了准确性之外,普通用户 危地马拉 whatsapp 电话号码列表 可能不会意识到翻译所需的计算资源。

在小红书这样内容丰富的平台上,用户发布的文字内容可能只有几封信或几百字,相比之下,翻译较长的内容会消耗更多资源,增加系统负载。

此外,由于用户来自不同的国家,时区分布广泛,这意味着系统很少会出现负载低的情况。

当双方都处于清醒状态时,短暂的时区重叠会导致翻译请求突然激增,需要系统在短时间内处理大量并发请求,这对其并发处理能力是一个重大考验。

小红书太酷了
新翻译功能采用的是哪种模型,目前还没有准确消息。在一些用户的“询问”下,似乎是GPT。也有用户“询问”后,发现是智普。

带有文本覆盖的 GPT-4 模型的 GIF。
考虑到成本问题,目前还很难说。GPT 的参数数量庞大,计算成本高,不适合在资源受限的环境中部署。

更可行的选择可能是选择学生模型并使用 GPT 作为教师模型进行蒸馏。学生模型通常具有更少的参数和更快的推理速度,同时尝试保留教师模型的功能。

同时,这种方式对小红书来说或许更有前景。

小红书一直在探索大型语言模型、多模态系统等人工智能技术,但一直专注于算法优化。他们之前开发了一些小型的人工智能功能。

很少有人知道,在2024年的AAAI大会上,小红书的搜索算法团队提出了模型蒸馏的新思路。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇

GMT+8, 2025-4-17 14:01 , Processed in 0.116798 second(s), 19 queries .

抗攻擊 by GameHost X3.4

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |