XORに新機能が付きました!

私が開発したPDF比較ツール『XOR』Version 1.1をリリースしました。変更箇所は以下の通りです。

  • 囲みの機能を追加
  • マスクの機能を追加
  • 細かい不具合を調整

囲みは「見つけた変更箇所をマーキングする機能」です。

マスクは逆に「変更がなかった箇所を覆い隠す機能」です。なお、

囲みとマスクはPDFを並べて表示した状態に戻したり、書き出したPDFやプリントアウトにも反映されます。

と、テキストで説明されても想像できないかもしれないので、こちらの動画をご覧ください。

そして印刷業やドキュメント制作に携わっている知り合いがいれば、ぜひ紹介していただけないかと。このツールを使えばきっと彼ら彼女らのお仕事が楽になるので知らせたことを感謝してもらえると思うので。

山中博被告の行方は解る?

このblogの「山中博氏は逮捕されるの?」や「BAYSIDE English Cebu乗っ取り事件の現状報告」といった過去記事にアクセスが続いています。フィリピンから逃亡脱出した山中博被告、松井元輝被告、土原弘人被告の行方を捜している方がおられるのでしょうね。

とはいえ私も何も知らないし、ネットを検索して得られる以上の情報は持っていません。そもそも私は山中被告と松井被告には会ったことがありません。土原被告とはBAYSIDE English Cebu滞在中に少しだけ事務的な話をしたことがあるけど大した印象もないので、もしどこかですれ違っても気づかないでしょう。

ついでに言うと私は事件の被害者である佐々木綾子さんともわずかな面識しかありません。佐々木さんが彼女のblogで書いていることにしても彼女の主観が多くて別の側面もあるとは思うけど、それでも学校の運営権や資産が彼らの手に渡ってしまったのは事実のはず。だったら明らかな犯罪です。まさかお子さんもいる彼女が彼らにそれらをプレゼントしたとは考えにくいので。山中博被告側にも言い分があるかもしれないけど「家の鍵が空いてたら盗んでもいい」なんてことはないのだし。脅迫にしても録音を取られているし、ちょっと言い逃れは無理でしょう。

よって私は部外者ながら、物事が正される方向で解決されて欲しいと思うのですよね。誰かが誰かに騙されたなんて話がまかり通るのは嫌だから。

ただし、現実問題、意図的に姿をくらました人を探すのは困難かも。先日、テレビで家賃をさんざん滞納して失踪した人を探す企画が放映されていました。元警察の人物が捜査に当たり、「当人がかつて温泉旅館に勤めていたから今も出身地の同業他社で働いている公算が高い」との推測から居場所を突き止めたけど、逆にいえば人探しはそれだけのスキルを要する難題なのでしょう。

もし自身が探偵だったとしても、彼らが過去の生活圏や交友関係から距離をとっていたなら、どうやって探したものかちょっと見当がつきません。彼らは既婚者でしたっけ?だったら奥さんの方から当たってみるかなぁ。

ましてや彼らは被告といってもフィリピンでの話。当然、日本の警察の指名手配一覧には載っていないので、日本でも告訴されるか、あるいは自ら何かをしでかして身元を照会されるようなことがない限り、一国民として普通に暮らせていかれるのではなかろうか。

フィリピン留学ラジオのサイトのスクリーンショット
フィリピン留学ラジオのサイトから

なお、先日フィリピン留学ラジオのサイト内でこの事件のことが時系列を追ってまとめられた記事が出たので紹介しておきます。

セブ島のベイサイドの刑事裁判まとめ!
佐々木綾子氏が山中博氏を告訴!学校乗っ取り事件!?

 

テキストの正確な読み上げはAIには無理

テキストの読み上げ精度を上げるには二つの方式が考えられます。

  • 徹底的にタグ付けする
  • 辞書を充実させ、AIを発展させる

ちなみに私は前者の信望者です。作業的には面倒になるけど確実だから。

後者、つまりAI技術でスマートに解決したいと思う人もいるかもしれないけど、例えば文中の「羽生」が「はにゅう」なのか「はぶ」なのかAIには正確に判断できないはずなので。

いや、テキストを解析してフィギュアスケートの記事だったらはにゅう選手だとわかるかもしれないけど、はぶさんがスポーツに取り組んだといった記事なら「はにゅう」と読んでしまうかも。増してや文中に登場するはぶさんやはにゅうさんが一般人だったら、あてずっぽうにならざるを得ないわけです。近年、キラキラネームを持つ人も増えているし。

それにAI方式だと、読み上げエンジンによって出来不出来の差が如実に出てしまいますよね。

よってどなたかテキスト読み上げのための標準仕様を策定して(まだ存在していないですよね?)、Apple、Google、Microsoft、Amazonなどに採用を促していただけないかと。残念ながら私にはその伝手がないので。

まあ、それが実現したら濱田祐太郎さんの「かとう せんにひゃくさんじゅうななだん」ってネタは過去の話になってしまうけど。

スクリーンレスメディアの恩恵

スクリーンレスメディアの発展を望むの続きです。

もしWebの世界にテキストに読み上げ用の仕組みが導入され普及し始めたなら、その恩恵を受けられる代表格は視覚障害者の方々かもしれません。

私は以前DAISY(デイジー)という視覚障害者向け規格の関連製品開発に関わる機会がありました。DAISYはAmazon Audibleにも似た音声メインのメディア規格です。

DAISI CONSOTIUM SCREEN SHOT

DAISYのコンテンツには複数の種類があります。例えばこちら。

  • 音声DAISY:頭出しなどができる録音データ
  • マルチメディアDAISY:画面にテキストを表示して、録音した音声を再生しながら、読み上げ箇所をハイライトする

でも、これらのコンテンツを作るのは大変なのですよね。何しろ誰かがテキストを通しで読み上げる必要があるので。確か爆笑問題の太田光さんのお母様がこの朗読に関わっておられたと伺っています。

それでも難読症を持つ人の割合が多く、ボランティア活動も盛んな米国などではかなりの制作体制が整っているそうだけど、日本ではまだまだだと聴いています。

よって私はWebそのものが音声読み上げ対応になる方が望ましいと思うのですよね。以下のような人でもコンテンツ制作に従事できるようになるから。

  1. 朗読が苦手な人
  2. 聞き取りやすい声質ではない人
  3. イントネーションに特徴がある人
  4. 外国語が正しい発音で読めない人

特に4.は多言語混在のテキストを作る際にバイリンガル、マルチリンガルの人を起用できないとどうにもなりません。英語だけとも限らないし。でも、外国語テキストを音声読み上げさせればその問題はクリアできます。

また、単純に分業も可能になりますよね。朗読だと途中から話者が変わると違和感を与えかねないけど、テキストベースなら誰がやっても同じです。長編小説などでも20ページずつ分けて作業といったことができます。

それに視覚障害者向けのコンテンツ作りなんて、よほどの公的な支援でもない限り、行き詰まるに決まっています。市場が小さい上に、障害者の財布をあてにしたビジネスなんて成り立つはずがないから。

でも、Webテキストの正確な読み上げは晴眼者にも需要はあるのでビジネス展開も期待できて、結果的に視覚障害者への恩恵も大きくなるだろうと。

スクリーンレスメディアの発展を望む

TBSラジオの荻上チキ Session 22を聴いていてScreenless Media Lab.なるサイトの存在を知りました。彼らによると、近頃耳で聞く音声情報の有効性が注目されてきているとのこと。同感です。表示される情報だと利用中ずっとスクリーンに向き合う必要があるから。

Screenless Media Lab.

それに音声には大きな利点もあって、例えば私はこのblogなどでテキストを書いた際、時間に余裕があればMacやiPhone、iPadのスピーチ機能を使って読み上げさせています。黙読だと脳で補正しながら読んでしまうけど、音声なら「てにおは」や文法のおかしな言い回しなどにも容易に気づけるから。

ただし、現状だと固有名詞や複数の読み方がある漢字などはかなり読み間違えます。例えば「悠仁様」は「ゆうじんさま」、さんざんニュースに登場する「辺野古」も「へんのいにしえ」と読んでしまうのですよね。私のアプリ「XOR」も「ゾー」だし。

よってWebの世界に読み上げ用のマークアップが導入されるのを心待ちにしています。例えばこんな感じに書けば読み間違われなくなるような。

  • <phonic><pb>辺野古</pb><pt>へのこ</pt></phonic>
  • <phonic><pb>XOR</pb><pt>エックスオーアール</pt></phonic>

ちなみに「phonic」は辞書によると「音(声)に関係のある」という意味らしいです。他にいい案があればもちろん置き換えてもらって構いません。

また、こんな指定もできるといいかと。

  • <p>このたびの改元は英語圏メディアでも「<phonic lang=”en”>Reiwa era began</phonic>」と報じられました</p>

日本語の文中に英文を挿入したい場合に便利です。そこだけ意図的に英語の読み上げエンジンで読ませられるようになると。もちろん他の言語の組み合わせもあり。英文は漢字ほど読み間違いがないにしても、文中で外国語を引用することはあるだろうし。

もっと言うと、こちらも。

  • <phonic lang=”ja” dialect=”osaka”>なんでやねん</phonic>
  • <phonic><pb>何ばしよっと?</pb><pt lang=”ja” dialect=”hakata”>なんばしよっと?</pt></phonic>
  • <phonic lang=”en-au”>I go to hospital today.</phonic>

そしてニュースサイトやテキストメインのWebサイトでは必ず「読み上げボタン」が設置されて、クリック(タップ)するとマークアップを踏まえて一連のテキストが読み上げられるようになってほしいです。

もちろん記事の書き手は読み上げが怪しい箇所に対してことごとくタグ付けする必要があります。どのエンジンでも同じように読み上げさせるのは大変だけど、ある程度までは作業を半自動化できるでしょう。

これ、地道な作業だけど将来に向けて大事なステップだと思うのですよね。例えば2001年宇宙の旅のHAL 9000やスタートレックのコンピュータを実現するためには避けて通れないだろうと。

しかも現存するテクノロジー水準でも仕様を策定して音声読み上げエンジンとWebブラウザのメーカーが対応してくれさえすれば割とあっさり実現できそうな気がするし。