ubuntuでhanlpを使用する方法

序文

以前は、ほとんどの中国の単語セグメンテーションにpythonの途切れ途切れの単語セグメンテーションツールを使用していました。単語セグメンテーションツールはAPIをオンラインで呼び出すことです。この単語セグメンテーションツールの原理については、良いブログをお勧めします。

http://blog.csdn.net/daniel_ustc/article/details/48195287.

プロジェクトのニーズに応じて、スタンフォード大学の自然言語処理パッケージstandfordを使用して依存関係ツリーを構築する必要がありますが、Standfordは、中国語の単語のセグメンテーションを実行させないように非常にいたずらをしています(古いエラー)。必死になって、私はサードパーティの単語セグメンテーションツールしか使用できません。 Standfordのソースコードはjavaであるため、対応する単語セグメンテーションツール、つまりhanlpを見つけました。

HanLPのインストールと使用

HanLPの大きなメリットの1つは、オフラインのオープンソースツールキットです。つまり、無料でダウンロードできる無料のコードを提供するだけでなく、収集した辞書を公開することもできます。これは無私の行動です。私がインストールするとき、私は主にこのブログを参照します:

http://m.blog.csdn.net/article/details?id=50938796

ただし、このブログでは主にWindowsでのhanlpの使用方法を紹介しており、ubuntuはlinuxであるため、違いがあります。以下では、主にunbuntuのインストールと使用法を紹介します。

Eclipseをインストールする

ターミナルにsudoget-apt install eclipse-platformと入力してワンクリックインストールを実行し、アプリケーションでeclipseを見つけます

hanlpをダウンロード

hanlpの公式ウェブサイトにアクセスしてください:http://hanlp.linrunsoft.com/services.html

hanlp.jar(プログラムパッケージ)、data.zip(辞書ライブラリ)、hanlp.properties(構成ファイル)をダウンロードします。以下はドキュメントです。ダウンロードする必要はありません。

data.zipをダウンロードするとき、ダウンロードリンクは少しわかりにくいです。青いdata-for-1.2.11.zipをクリックすると、Baiduクラウドリンクが表示されます。

jarパッケージをインポートします

hanlpをeclipseにインポートします。特定のプロセスは、次のWebサイトを参照できます。

http://jingyan.baidu.com/article/ca41422fc76c4a1eae99ed9f.html

構成ファイルのインポート

hanlp.propertieをプロジェクトのbinディレクトリにコピーし、辞書のパスを変更します

ルートのパスをデータが保存されているパスに変更します(データを解凍することを忘れないでください)

プログラミングコードのデモンストレーション

import java.util.List;

import com.hankcs.hanlp.HanLP;

import com.hankcs.hanlp.seg.Segment;

import com.hankcs.hanlp.seg.common.Term;

public class DemoHanLP {

public static void main(String[] agrs){

文字列文= "みなさん、こんにちは。私の名前はクインシーです。";

Segment segment = HanLP.newSegment();

List termList = segment.seg(sentence);

for(Term term : termList){

System.out.print(term+ " ");

    }

}

}

動作結果:

この記事はQuincy1994のブログからのものです

Recommended Posts

ubuntuでhanlpを使用する方法
UbuntuでTensorFlow使用環境を構成する方法
Ubuntuシステムでdpkgコマンドを使用する方法
ubuntuでのHanlpの使用の概要
UbuntuにHelmをインストールする方法
Ubuntu14.04にmysqlをインストールする方法
Puttyを使用してVirtualBoxにインストールされているubuntuにログインする方法
Ubuntu14.04にmysqlをインストールする方法
PythonでSQLiteを使用する方法
Ubuntuでスワップパーティションを追加する方法
UbuntuでopenJDKを簡単にコンパイルする方法
およびおよびまたはPythonでの使用方法
Ubuntuにcuda10.1ドライバーをインストールする方法
UbuntuでSudoersにユーザーを追加する方法
Ubuntuで冗長カーネルを削除する方法
Ubuntuで冗長カーネルを削除する方法
Ubuntu16.04でSambaサーバーを使用する方法
Ubuntu20.04にROSNoeticをインストールする方法
ubuntu14.04で静的IPを設定する方法
Ubuntu7.10でソフトウェアソースを変更する方法
Ubuntu20.04でルートアカウントを開く方法
Ubuntu Dashでアプリケーションを非表示にする方法は?
Ubuntu20.04にアップグレードする方法
ubuntuでスーパーバイザーを使用する
Ubuntu20.04にアップグレードする方法
Prometheusを使用してUbuntu14.04サーバーを監視する方法
pythonでround関数を使用する方法
ubuntuでタイムゾーンと時間を変更する方法
Pythonでzip関数を使用する方法
Ubuntu16.04でNginxのマップモジュールを使用する方法
Ubuntu20.04にDockerをインストールして使用する方法
ubuntuサーバー環境にpythonをインストールする方法
Ubuntu18.04にCurlをインストールして使用する方法
Ubuntu18.04にComposerをインストールして使用する方法
Ubuntu18.04にWineをインストールして使用する方法
pythonでformat関数を使用する方法
Ubuntu14.04でDockerデータボリュームを使用する方法
win10でubuntuシステムを開く方法
pythonでアシスタントを実行するコードを使用する方法
Ubuntu20.04にComposerをインストールして使用する方法
Ubuntu14.04にBaasBoxをインストールして使用する方法
Jenkinsを使用してUbuntuで自動的にビルドする方法
Ubuntu16.04にPostgreSQLをインストールして使用する方法
Ubuntuシステムログで/ var / log / messagesを構成する方法
Ubuntu16.04にDockerをインストールして使用する方法
UbuntuでのAnacondaの使用
パイソンタプルの使い方
virtualboxを使用してubuntuをデプロイします
Ubuntu 16.04LTSにアップグレードする方法
Ubuntu18.04にスタンドアロンモードでHadoopをインストールする方法
LVMを使用してUbuntu18.04でストレージデバイスを管理する方法
Ubuntu14.04でMongoDBバックアップを作成して使用する方法
Ubuntu18.04にMySQLWorkbenchをインストールして使用する方法
Ubuntuで詳細なネットワークルーティングテーブルを表示する方法
ubuntuシステムでタイムゾーンと時間を変更する方法
Ubuntu20.04でIPアドレスを変更する方法の例
Ubuntu14.04でPython仮想環境を作成する方法
Ubuntu20.04にMemcachedをインストールする方法
Pythonのフィルター機能の使い方
pythonのヘルプ機能の使い方
Ubuntu20.04にJavaをインストールする方法