
富士通とジャストシステムは4月24日、スマートフォン向け文字入力システム「Super ATOK ULTIAS(スーパー エイトック ウルティアス)」を発表した。両社の共同開発によるもので、最新のPC版「ATOK」相当の推測エンジンや登録語彙数を実現したという。2014年夏以降の富士通製スマートフォンなどに搭載される。
入力した言葉や文脈に合わせて適切な予測を表示する機能や、打ち間違いを修正して適切な表記候補を知らせる機能などが使える。新機能としては、文字種をまたいだ予測候補の表示や、日本語入力時の英語への変換、使用するアプリケーションに合わせて最適な予測変換候補を表示する機能などを搭載した。なお現時点で、アプリに合わせた予測変換候補の最適化機能は、富士通の端末のプリインストールアプリを中心に対応する。
旬なワードを自動受信する機能も備えた。「ビジネストレンド」「エンタメ・カルチャー」など5つのジャンルに関連した言葉が毎週無料で追加され、常に最新のものが使えるとしている。
富士通 モバイル事業本部長の?田克美氏は、Super ATOK ULTIASを開発した理由について、スマートフォンユーザーの中で「文字入力」への不満が増えていることを挙げた。独自の調査結果を示しながら「電話などの音声からメールやLINEなどのテキストへとコミュニケーションが変化しているなか、より使いやすい文字入力が求められている。これからのスマホに求められる重要な機能である」と述べた。
また?田氏は、富士通がベンチマークした中では「スマホ史上最高のATOK」としながらも「機能の善し悪しを決めるのはお客様」と話し、今後の端末製品の販売面でどのように寄与するかという問いには「計画は持ち合わせていない」と答えた。
ジャストシステム CPS事業部長の田食雅之(たじき まさゆき)氏は、Super ATOK ULTIASを富士通以外に提供する予定はないとする。会見ではATOKシリーズの歴史を振り返り「名前に『ATOK』を入れても問題ないと思い、Super ATOK ULTIASを出した」と自信を見せた。
なお、富士通の2014年夏モデルは取扱いキャリアも含めて未発表だ。
マンガ業界の今が分かる出版社擬人化4コマ「飯田橋のふたばちゃん」が読めるのはITmedia eBook USERだけ! ――双葉社のWEBコミックアクションから完全移籍で月8本にボリュームアップ! 月ごとにストーリーを持たせた出張版とはひと味異なる展開を読めば業界通になること間違いなし? 今月はみんなでサイクリング! ……のはずが。前のおはなし「勝負はこれから」はこちらです。
【他の画像】
●【その83】ワイルドなあの子
もういい……もう……休めっ……!
[原作・横山了一 作画・加藤マユミ,eBook USER]
MITの学生 Kevin Kwok 氏が、ウェブ画像中の文字を通常のテキストのように選択・コピーできるChrome拡張機能 Project Naptha を公開しました。
あらゆる画像中の文字を選択・コピー・消去・置換・翻訳するChrome拡張 Project Naptha
ただのテキストのように見えて選択できない埋め込み画像はもちろん、スキャンした文書やウェブ漫画、イラスト中の文、スクリーンショット中のテキスト、あるいは写真に写った看板などの文字までコピーでき、さらには文字を消したり置き換えたり、翻訳サービスに投げて訳すことさえできます。
Kwok氏によると、Project Naptha は新入生として初参加したハッカソンイベント HackMIT 2013 で二位に入賞した " Images as Text " を元に改良したコード。技術的な解説によれば、画像中に文字があるかどうかは、Microsoft Research が開発した Stroke Width Transform アルゴリズムなどいくつかの手法を組み合わせて判断します。文字認識にはオープンソースOCRエンジン Ocrad のJavaScript 版でローカル処理するか、より高度なクラウドベースのOCRに投げるかどうかを選択可能です。
またOCRと翻訳については、ユーザーがテキスト選択を始めたタイミングで、Project Napthaのキャッシュサーバに問い合わせて同一の内容がないかどうか確認します。これは「ユーザー識別情報を持たないHTTPSリクエスト」のみを送るとされていますが、オプションから一括で無効にしてローカル動作のみにしたり(Disable lookup)、あるいは特定のドメインやページについてルックアップしないように設定もできます。
面白いのは、選択やコピーができるだけでなく、画像中の文字をある程度自然に消去したり、自分で入力した文字や翻訳サービスの翻訳結果と置き換えられること。
これはOCRに渡すために認識した文字の輪郭をマスクとして使い、消した部分は周辺の色で埋めてごまかすことで処理しています。Photoshop などの画像処理ソフトで使われる Content-Aware Fill のような仕組み。このほか採用したさまざまな手法については、リンク先の作者サイトで詳しい解説があります。
ロシア語から日本語に直接翻訳した例。翻訳エンジン側の精度の問題で「4月10日から27日」が解釈できなかったりしますが、ロシア語から機械翻訳の相性が良い英語などに翻訳したり、コピーしてから別の翻訳エンジンに渡すことはできます。「15%」が「15°/O」(15度スラッシュオー)になっているのはOCRの精度。
ベータ機能のテキスト編集(置き換え)例。ロシア語 IKEAカタログ内の値札を勝手に1000円に書き換え。
日本語OCRも選択できますが、使い物になりません。
Project Naptha はChromeブラウザの拡張機能としてChromeウェブストアから無料でダウンロードできます。ソフトの性質上、Project NapthaのOCR / 翻訳キャッシュサーバと通信したり、ブラウザ内で読んだテキストをクラウドベースのOCRや翻訳サービスに渡すオプションなどの関係でパーミッションを与える必要がありますが、ちょっとだけ試したい場合は Project Napthaのサイト全体がライブデモになっており、インストールせずに実際に試せます。