テキストマイニングとは、文章を定量的に扱うための分析手法でアンケートやコールセンターのお問い合わせの内容、TwitterやInstagramのSNSでの口コミ分析などの分野で活用されるものです。
文章を単語単位に分割し、過去形などの変化も戻して言葉として集計できるようにすることが必須でこの手法を形態素解析と呼ばれます。
形態素解析の精度が近年上昇してきているので広く使用されることが多くなり、単語間の意味的な繋がり見る係り受け解析(構文解析)と一緒に使用されることが多いです。
テキストマイニングを行う目的は、
・ニーズの発見
・将来の予測
・業務課題の発見
1つずつ詳しく解説していきます。
アンケートやコールセンターへのお問い合わせ内容をテキストマイニングすることで年齢や季節など意見の種類を多面的な視点で顧客の意見を知ることで顧客が抱いているニーズを明確にすることができます。
商品が売れないなど「なぜ」の原因を追求に役立てることができます。
TwitterやInstagramに書かれているコメントには有益な情報を多く含んでいます。
そのコメントをビッグデータとして活用することができます。
コメントを解析することで流行や顧客のニーズを理解することで今から流行るものを先に強いれるなど将来の予測を行うことができます。
日々の日報や作業報告書などのレポートをテキストマイニングすることで抽出したデータをナレッジとして共有することができます。
日報や作業報告書から業務の問題点を可視化することができ、属人化している業務であれば業務の平準化、営業成績が優秀な従業員のナレッジがあればスキルの平準化に期待ができます。
テキストマイニングの手法は、大きく3つあります。
・センチメント分析
・主成分分析
・対応分析
1つずつ詳しく解説していきます。
テキストマイニングを行う上で最も一般的な手法で顧客の感情を分析する時に使用されます。
顧客が商品やサービスを利用する際にどのような感情を持っているか、それが肯定的か否定的か中立的かの3つで評価をするのが基本的です。
しかし、世代によっては同じ言葉でも違った感情を表すこともあります。
具体的には「やばい」という言葉ですが若い世代には肯定的な言葉で使用されることが多いですが、年齢が高くなると否定的な意味で使用されることが多くなります。
曖昧な意味を持っている言葉は対象によって解釈が異なる場合があるので注意しましょう。
膨大なデータを分析する際に活用されることが多い手法です。
ビッグデータなどの膨大なデータには多くの項目があります。
項目が多くなってしまうと分析の妨げとなってしまうことがあるので項目を少なくすることでデータ分析を行いやすくなります。
主成分分析では一部のデータを切り捨てることになり、全ての情報を見ることはしません。
切り捨てたデータに重要なデータが含まれていることも多々あるので主成分分析をする際には切り捨てる項目を慎重に判断する必要があります。
「コレスポンデンス分析」とも呼ばれる手法で設問を掛け合わせて作成する「クロス集計」や編集や集計を行う前の「ローデータ」を散布図で表す分析手法になります。
アンケートでは、「クロス集計」を使用することが多くなり、項目が多くなると結果を把握しづらくなってしまうことがあります。
散布図にする際には項目の関係性が可視化され、対象データを比較しやすくなるので対応分析は、企画書やブランドイメージの分析に活用されることが多くあります。
SEO支援は1業界あたり1社までの先着順となります為、お断りさせていただく場合もございます。ご了承ください。
Web業界10年以上の知見を持って、無料にてご相談へ対応いたします。
情報収集目的でも歓迎です。お気軽にご連絡ください。