x-cmd pkg | franc-cli - 文本语言检测工具
简介
franc-cli 是文本语言检测工具,用于识别文本所使用的自然语言,最多可识别 419 种语言。
注意:
- franc 参与的决策过程的语言很多,这意味着它对短文本片段的检测是不够准确的。
- franc 返回 ISO 639-3 代码(三个字母代码)。而不是ISO 639-1 或 ISO 639-2。
首次用户
-
使用
x env use franc-cli
即可自动下载并使用 -
x-cmd 提供1分钟教程,其中包含了 franc-cli 命令常用功能的 demo 示例,可以帮你快速上手 franc-cli 。
-
使用案例:
# 安装 franc-cli x env use franc-cli # 检测文本自然语言,cmn 代表普通话中文,eng 代表英文 franc "Alle menslike wesens word vry" # 检测标准输入中文本的自然语言 echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc # 忽略某些语言 franc --ignore por,glg "O Brasil caiu 26 posições" # 指定语言范围 echo "Alle mennesker er født frie og" | franc --only nob,dan
功能特点
- 支持比任何其他库更多的语言:提供 3 类语言包,默认使用的 franc 语言支持 187 种语言,franc-min 语言包支持 82 种语言,franc-all 语言包支持 419 种语言。
- 相应的衍生作品可移植到其他语言:franc 有多种编程语言的移植版,包括 GO、R、Rust、Python 等。
竞品和相关作品
-
whatlang-rs:franc 的衍生作品,使用 Rust 编写,支持 69 种语言。
-
lingua-go:Go 语言编写的自然语言检测库,适用于短文本和混合语言文本,支持 75 种语言。
进一步阅读
- franc-cli 源代码 - franc-cli 项目的源代码托管在 GitHub,你可以在这里找到最新版本的 franc-cli 和参与社区贡献。
原文地址:https://blog.csdn.net/edwinjhlee/article/details/135697576
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!