blog_suuri-icatch.png

2019.11.25

読了時間:3分

数理システム ユーザーコンファレンス2019にて事例発表

加藤大輔

11月22日に東京・品川で開催された「数理システム ユーザーコンファレンス2019」にて事例紹介の講演をしてきました。本稿では発表した講演内容の紹介とコンファレンスの簡単なレポートをしていきます。

数理システムのソフトウェアユーザーによる事例発表や講演を通じて、ユーザー間での情報共有や交流が行われる場です。講演は製造やマーケティングなどのセッションに分けられ、それぞれの最新事例について発表されました。

今回sodaはCS向上セッションとして数理システムソフトウェア「Visual Mining Studio」、「Text Mining Studio」、「Deep Learner」を活用した事例を発表させていただきました。

講演タイトル「VMS・TMS・Deep Learnerでサクッと自然言語処理」

※VMS = Visual Mining Studio、TMS = Text Mining Studio

blog_suuri-01.jpg

発表を行う弊社倉田

事例概要はアンケート内のフリーアンサーをテキストマイニングすることで、どのような意見がどの程度あるのかを可視化するというものです。本講演の前半ではTMSを活用したテキストマイニングの分かち書きから類義語辞書の作成、集計・分析までの手順を説明しました。

blog_suuri-02.jpg

後半ではテキストマイニングのタスクにおいて特に時間を要してしまう類義語辞書の作成をDeep Learnerを活用して効率化が図れないか、実際に検証した結果を紹介しました。
Deep Learnerの機能「Word Embedding」を用いて単語の分散表現を獲得し、クラスタリングすることで類義語の一覧を作成しています。
精度としては改善の余地がありますが、大幅に作業の効率化ができる可能性を示しています。

blog_suuri-03.jpg

blog_suuri-04.jpg

また、似通った内容のフリーアンサーをテーマ毎に分類するために、単語の分散表現と語句の並びのルールを学習するseq2seqモデルを用いた手法を紹介しました。

blog_suuri-05.jpg

blog_suuri-06.jpg

コンファレンスでは様々な分野におけるデータ分析の活用事例が発表されていました。その中でも特に気になった講演を紹介します。

株式会社パルコ
CRMプランニングにおける顧客データ分析事例の紹介とプランニングにおけるデータ分析の重要性についての講演でした。
Life Time Value(顧客生涯価値)の向上を成果指標としたときに、単に「客単価」を見るのではなく、LTVが「維持(継続)」と「頻度」により形成されていると仮説立て、「維持(継続)」に影響のある変数は何であるのかを分析し、顧客育成ロードマップの作成に取り組まれていました。成果指標の向上のための変数をデータ分析により探していくことが、ディープラーニングにおける目的変数に対して重要な説明変数を選択する点に近く、大変興味深く参考になった講演でした。

最後に

当日はあいにくの天気でしたが、多くの参加者が集まり大変盛況していました。データを分析したうえで何に活用していくべきか、さらに注目が集まっているのだと実感します。多くの最新事例が集まるこのコンファレンスは情報収集としても大いに役立ちますので、また次回も参加したいと思います。

RELATED POST

topic_thum.png
  • 技術説明

2021.01.21

トピックモデルとは?

トピックモデルは、自然言語処理の分野で用いられる統計的潜在意味解析の一つで「言葉の意味」を統計的に解析していく手法です。 統計的潜在意味解析では、文章を複数の単語の集まりであると捉え、それら単語の共起性に着目して文章をいくつかのクラスに分類していきます。そのクラスに集まっている単語が意味する内容を「...

impulse_thum.png
  • 技術説明

2021.01.21

インパルス応答関数とは?

インパルス応答関数とは、複数の要因(変数)が影響しあっている時系列分析に用いられる手法のひとつで、ある変数にショックを与える(値を変動させる)と、それが他の変数に与える影響を分析することができます。主に工学分野で利用されていますが、ファイナンスやマーケティングでも応用されます。 例えば、円/ドルの為...