外国語の文章の言語を予測するツール

Wikipediaの各言語のテキストデータを訓練データとして学習したモデルを用いて、外国語の文章の言語を予測します。
判定言語:英語、フランス語、スペイン語、インドネシア後、タガログ語

テキストデータ入力

予測結果

入力したテキスト

参考情報

  • Pythonによるスクレイピング 機械学習 [開発テクニック]、ソシム株式会社
  • 本ツールは下記書籍を参考に作成しました。
    Pythonを使った機械学習プログラミングをする上で、具体的なものを作るとっかかりとして、とても判りやすい参考書だと思います。
  • 開発メモ(作成中)