自動テキスト要約ソリューションを2021年1月から提供開始

Press Release

2020年12月14日

報道関係 各位

株式会社クラスキャット

TensorFlow 2 対応 日本語 ALBERT モデルをベースとする最適化可能な
自動テキスト要約ソリューションを 2021 年 1 月から提供開始

-「ClassCat(R) Text Summarizer v2.0」-

株式会社クラスキャット (代表取締役社長:佐々木規行、茨城県取手市) は、最新の深層学習技術をベースとする、最適化可能な多言語対応の自動テキスト要約ソリューション「ClassCat(R) Text Summarizer v2.0」を 2021年1月から提供開始することを発表致しました。

本製品は「ClassCat(R) Text Summarizer」シリーズの最新版で ALBERT と呼称される自然言語処理技術を応用しています。ALBERT は汎用性のある軽量なモデルであるために低コストで対象領域に最適化が可能になっている点が特徴的ですが、複数の埋め込みモデル(*1)を組み合せて精度をあげることも可能になっています。

日本語と英語にデフォルトで対応しており印欧語についてもオプションで提供可能ですが、他のどのような言語にも対応可能です。実装は標準的な深層学習フレームワークの最新版 TensorFlow 2.3 を利用しています。

本製品「ClassCat(R) Text Summarizer v2.0」は最新の深層学習技術により高品質なテキスト要約が可能になっています。自動テキスト要約は人工知能による自然言語処理の伝統的なタスクです。

インターネット上で膨大なドキュメントが溢れる中、必要なドキュメントの取捨選択を容易にし、テキストの類似度を利用したドキュメント検索システムへの応用も可能です。人間のテキスト要約よりもバイアスがかからず偏りがないという優位点もあります。

自動テキスト要約は一般に抽出型と生成型に分けられますが、本製品は文章テキストから要約文を選択する抽出型に該当します。

本製品「ClassCat(R) Text Summarizer v2.0」は多言語に対応しています。日本語と英語にデフォルトで対応しており、印欧語 (ドイツ語・フランス語・スペイン語・イタリア語・ポルトガル語) についてもオプションで提供可能です。

軽量なモデルである ALBERT の上に構築されていますので、他のどのような言語にも低コストで対応可能です。また、BERT(*2)を含む複数のテキスト埋め込みモデルを組み合せて精度をあげることも可能になっています。

本製品「ClassCat(R) Text Summarizer v2.0」の動作環境はマルチクラウドに対応しています。各種パブリッククラウド Amazon EC2、Microsoft Azure、IBM Cloud、Google Cloud Platform 上のインスタンスやベアメタルで提供されます。GPU 装備が推奨されます。

【用語】
1) 埋め込みモデルは、文脈を考慮しつつテキストを固定長ベクトルに変換する自然言語処理モデルです。
2) BERT (Bidirectional Encoder Representations from Transformers) は「Transformer からの双方向エンコーダ表現」を意味します。

【製品販売概要】
・製品名:ClassCat(R) Text Summarizer v2.0
・販売時期:2021年1月
・販売形態:直接販売・販売パートナー経由・OEM
・販売価格:オープンプライス

【動作環境】
・OS:Ubuntu Server 18.04 LTS
・ハードウェア:各種パブリッククラウドの仮想サーバ、ベアメタルサーバ (GPU 推奨)

◆ お問合せ ◆
本件に関するお問い合わせ先は下記までお願いいたします。

株式会社クラスキャット
〒300-1525 茨城県取手市桜ヶ丘 4-48-7
セールス・マーケティング本部 セールス・インフォメーション
E-Mail:sales-info@classcat.com
WebSite:https://www.classcat.com/
Facebook:https://www.facebook.com/ClassCatJP/
Twitter:https://twitter.com/ClassCat_AI_Lab/

※ ClassCat は株式会社クラスキャットの登録商標です。
※ その他、記載されている会社名・製品名は各社の登録商標または商標です。