Thursday, March 27, 2014

SmartNews(スマートニュース)は形態素解析で自動的に見出しを読みやすくなるよう改行している

先日、勉強会でスマートニュースの藤村さんのお話を伺う機会があったのですが、その時に聞いて一番印象に残った話が、これです。

SmartNews(スマートニュース)は形態素解析で自動的に見出しを読みやすくなるよう改行している

形態素解析とは、単語を品詞などの切れめで分割していくプロセスのこと。

楽天で働いていたときに、形容詞などがたくさんついている長い商品名を形態素解析で解析して、キーワードを抽出し、楽天での検索結果をどのように向上させていくか、といったことに使っていました。

この形態疎解析がスマートニュースではどのように使われているのか、実際のスマートニュースの画面で説明してみます。

冒頭の、西川貴教の記事がわかりやすいですね。
二行目から三行目、
「信じて」と「一緒に」の間で改行されています。
その他の見出しも、冒頭に名詞がくるように改行されているのがわかると思います。

これにはメリットだけではなく、表示される情報量が少なくなってしまうというデメリットもあるのですが、見出しを読みやすくすることでユーザーエクスペリエンスを高めているということですね。

冒頭の記事では、最後が「信じてやっていくしか...」となっていますが、形態素解析による改行処理が入っていなければ、「信じてやってくしかない」と二文字余分に表示することができるわけです。

皆さんの手元でスマートニュースを開いてみても、記事が品詞の切れ目で改行されているのがわかると思います。

これを聞いたときに、そこまでこだわって自動的に処理しているのか。
スゲー
と単純に思いました。

なんとなく、スマートニュースは読みやすいなーと思っていたのですが。
言われて始めてそうした処理がなされていることに気がつきました。

他のニュースアプリをみてみても、この形態素改正による改行は入っていないですね。
「グノシー」や本日リリースされた「Presso by はてなブックマーク」をみてみると、

グノシー

冒頭の北海道の見出しは、形態素解析を使って改行をした場合は、「室蘭市」の前で改行されることになります。

Presso

この場合も形態素解析を使って自動改行されるようにすると、「美少女」あるいは「Mobage」の前で見出しが改行されることになります。

各社他にもすぐには気づかないような工夫をされているのでしょうね。
そのことに気がつかされたエピソードでした。

このブロガーをtwitterでフォローする