admin 管理员组文章数量: 1184232
简介
根据翻译模型离线翻译,语言python
环境(python3)
pip install transformers ## 安装依赖
示例
from transformers import MarianTokenizer, MarianMTModel
## 加载模型
def get_model(src, trg):
model_name = f"Helsinki-NLP/opus-mt-{src}-{trg}"
model = MarianMTModel.from_pretrained(model_name)
tokenizer = MarianTokenizer.from_pretrained(model_name)
return model, tokenizer
## 模型英文->中文
def get_model_en_zh():
src = "en" # source language
trg = "zh" # target language
return get_model(src, trg)
## 模型中文->英文
def get_model_zh_en():
src = "zh" # source language
trg = "en" # target language
return get_model(src, trg)
## 翻译
def trans(model, tokenizer, sample_text):
batch = tokenizer([sample_text], return_tensors="pt")
generated_ids = model.generate(**batch)
text = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
return text
model, tokenizer = get_model_zh_en()
o_zh_text = "今天天气不错" # 原数据
print("o_zh: ", o_zh_text)
en_text = trans(model, tokenizer, o_zh_text)
print("en: ", en_text) ## 翻译为英文
zhModel, zhTokenizer = get_model_en_zh()
tzh_text = trans(zhModel, zhTokenizer, en_text)
print("t_zh: ", tzh_text) ## 再翻译为中文
结果
o_zh: 今天天气不错 ## 原始中文
en: It's a nice day. ## 翻译的英文
t_zh: 今天天气不错 ## 再次翻译的中文
版权声明:本文标题:文本翻译(中文翻译英文,英文翻译中文) 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1764012082a3286430.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论