Jetpackが犯人

いつからかこのblogの画像がところどころ表示されなくなっていました。

Frogfish.jpの画面例
上の写真が空白になり青い「?」マークが表示されています。

関連エントリの紹介エリアもこの有り様です。

Frogfish.jpの画面例

ちなみに「?」マークの写真のURLは以下のようになっています。

https://i2.wp.com/frogfish.jp/wp-content/uploads/2019/06/D7K_5504.jpg?w=1024&ssl=1

冒頭の「i2.wp.com」って何だろうと疑問に思いWebを検索してたところ、どうやらJetpackが画像を高速表示するために置き換えているようです。

狙いは解るけど、そもそも表示されないのでは高速化も何もありません。そこで対処方法を見つけました。Jetpackの設定画面で以下のオプションをオフにすると画像が表示されるようになります。

Jetpack設定画面

Jetpack、便利ではあるけど、ときおり悪さをしてくれたりもします。以前、知り合いのWebサイトで導入したら、Jetpackによる過負荷でサーバーが無反応になってしまったこともあったし。

おバカな人もいるもので

先日、東洋経済に『オンラインで英会話ネット学習はこんなにも進化している』という記事を見つけました。

内容は読んでいただくとして、気になったのがコメント欄。「お金の無駄」だの「先人達はそんなサービスなしでも英語力を身につけた」だのとケチをつけたがる人が散見されるのですよね。なんと愚かな。それって「自身は馬鹿です」と白状しているようなものなのに。まあ、ネットの世界なんて大抵そうか。

もしコメント主が学校の教科書や辞書、図書館の書籍、NHKの教育番組など費用がかからない手段のみで実用レベルの英語力を身につけたというならそう書くはずだから、自身には英語力がないのに他者を揶揄しているということが解ります。抜け駆けされている気になって、やる気のある人の足を引っ張りたいのかも。

それに、連中は思いっきり勘違いしています。オンライン英会話学習は良くも悪くもあまたある手段の一つにすぎません。学習教材や英会話学校と同列の。つまりは使い方次第です。大学だって学費を無駄にする人もいれば、ちゃんと成果を得る人もいます。英語を使って活躍している先人だって最初は何らかの教材なり学習サービス、留学などを通じて英語力を培ったはずだし、すでにオンラインで英会話ネット学習が存在していたならばきっと取り入れたことでしょう。

そしてネット越しのオンライン英会話は、10年ぐらい前に流行った「聞き流すだけで」系よりも進歩的です。あれって「定番フレーズで訊かれた際に決まり文句を返せるようになる」というコンセプトだったはずだけど、オンライン英会話は主に会話の訓練。これって各種教材やYoutubeの講座とは違って双方向だから発音の矯正にも有効です。また、特に英語を話す友人知人がいない人にとっては唯一の機会でしょう。しかも1日あたり200円とかだし。

というわけで私も最近とあるサービスにお試し入会してみたけど、有意義だと思いますよ。私の場合、TOEIC何点以上といった目標はなく、「旅先で不自由しない程度の英語力を」って要件だからすでに身についている気もするけど、当然もっと伸ばせばさらに意思疎通が楽にできるわけだから、やる価値はあります。

ちなみに私が今まで話したことがある講師の国籍はこちら。

NativeCampのキャンペーン
今まで話したことのある講師の国籍。フィリピン、カメルーン、ナイジェリア、南アフリカ、イラン、セルビア、メキシコ、セネガル、 モンテネグロ、ジンバブエなど

普通に生活していればフィリピン以外の人とは話す機会がなかったと思うけど、国ごとに特徴が違う英語に接するのも面白いものです。

テキストの正確な読み上げはAIには無理

テキストの読み上げ精度を上げるには二つの方式が考えられます。

  • 徹底的にタグ付けする
  • 辞書を充実させ、AIを発展させる

ちなみに私は前者の信望者です。作業的には面倒になるけど確実だから。

後者、つまりAI技術でスマートに解決したいと思う人もいるかもしれないけど、例えば文中の「羽生」が「はにゅう」なのか「はぶ」なのかAIには正確に判断できないはずなので。

いや、テキストを解析してフィギュアスケートの記事だったらはにゅう選手だとわかるかもしれないけど、はぶさんがスポーツに取り組んだといった記事なら「はにゅう」と読んでしまうかも。増してや文中に登場するはぶさんやはにゅうさんが一般人だったら、あてずっぽうにならざるを得ないわけです。近年、キラキラネームを持つ人も増えているし。

それにAI方式だと、読み上げエンジンによって出来不出来の差が如実に出てしまいますよね。

よってどなたかテキスト読み上げのための標準仕様を策定して(まだ存在していないですよね?)、Apple、Google、Microsoft、Amazonなどに採用を促していただけないかと。残念ながら私にはその伝手がないので。

まあ、それが実現したら濱田祐太郎さんの「かとう せんにひゃくさんじゅうななだん」ってネタは過去の話になってしまうけど。

スクリーンレスメディアの恩恵

スクリーンレスメディアの発展を望むの続きです。

もしWebの世界にテキストに読み上げ用の仕組みが導入され普及し始めたなら、その恩恵を受けられる代表格は視覚障害者の方々かもしれません。

私は以前DAISY(デイジー)という視覚障害者向け規格の関連製品開発に関わる機会がありました。DAISYはAmazon Audibleにも似た音声メインのメディア規格です。

DAISI CONSOTIUM SCREEN SHOT

DAISYのコンテンツには複数の種類があります。例えばこちら。

  • 音声DAISY:頭出しなどができる録音データ
  • マルチメディアDAISY:画面にテキストを表示して、録音した音声を再生しながら、読み上げ箇所をハイライトする

でも、これらのコンテンツを作るのは大変なのですよね。何しろ誰かがテキストを通しで読み上げる必要があるので。確か爆笑問題の太田光さんのお母様がこの朗読に関わっておられたと伺っています。

それでも難読症を持つ人の割合が多く、ボランティア活動も盛んな米国などではかなりの制作体制が整っているそうだけど、日本ではまだまだだと聴いています。

よって私はWebそのものが音声読み上げ対応になる方が望ましいと思うのですよね。以下のような人でもコンテンツ制作に従事できるようになるから。

  1. 朗読が苦手な人
  2. 聞き取りやすい声質ではない人
  3. イントネーションに特徴がある人
  4. 外国語が正しい発音で読めない人

特に4.は多言語混在のテキストを作る際にバイリンガル、マルチリンガルの人を起用できないとどうにもなりません。英語だけとも限らないし。でも、外国語テキストを音声読み上げさせればその問題はクリアできます。

また、単純に分業も可能になりますよね。朗読だと途中から話者が変わると違和感を与えかねないけど、テキストベースなら誰がやっても同じです。長編小説などでも20ページずつ分けて作業といったことができます。

それに視覚障害者向けのコンテンツ作りなんて、よほどの公的な支援でもない限り、行き詰まるに決まっています。市場が小さい上に、障害者の財布をあてにしたビジネスなんて成り立つはずがないから。

でも、Webテキストの正確な読み上げは晴眼者にも需要はあるのでビジネス展開も期待できて、結果的に視覚障害者への恩恵も大きくなるだろうと。

スクリーンレスメディアの発展を望む

TBSラジオの荻上チキ Session 22を聴いていてScreenless Media Lab.なるサイトの存在を知りました。彼らによると、近頃耳で聞く音声情報の有効性が注目されてきているとのこと。同感です。表示される情報だと利用中ずっとスクリーンに向き合う必要があるから。

Screenless Media Lab.

それに音声には大きな利点もあって、例えば私はこのblogなどでテキストを書いた際、時間に余裕があればMacやiPhone、iPadのスピーチ機能を使って読み上げさせています。黙読だと脳で補正しながら読んでしまうけど、音声なら「てにおは」や文法のおかしな言い回しなどにも容易に気づけるから。

ただし、現状だと固有名詞や複数の読み方がある漢字などはかなり読み間違えます。例えば「悠仁様」は「ゆうじんさま」、さんざんニュースに登場する「辺野古」も「へんのいにしえ」と読んでしまうのですよね。私のアプリ「XOR」も「ゾー」だし。

よってWebの世界に読み上げ用のマークアップが導入されるのを心待ちにしています。例えばこんな感じに書けば読み間違われなくなるような。

  • <phonic><pb>辺野古</pb><pt>へのこ</pt></phonic>
  • <phonic><pb>XOR</pb><pt>エックスオーアール</pt></phonic>

ちなみに「phonic」は辞書によると「音(声)に関係のある」という意味らしいです。他にいい案があればもちろん置き換えてもらって構いません。

また、こんな指定もできるといいかと。

  • <p>このたびの改元は英語圏メディアでも「<phonic lang=”en”>Reiwa era began</phonic>」と報じられました</p>

日本語の文中に英文を挿入したい場合に便利です。そこだけ意図的に英語の読み上げエンジンで読ませられるようになると。もちろん他の言語の組み合わせもあり。英文は漢字ほど読み間違いがないにしても、文中で外国語を引用することはあるだろうし。

もっと言うと、こちらも。

  • <phonic lang=”ja” dialect=”osaka”>なんでやねん</phonic>
  • <phonic><pb>何ばしよっと?</pb><pt lang=”ja” dialect=”hakata”>なんばしよっと?</pt></phonic>
  • <phonic lang=”en-au”>I go to hospital today.</phonic>

そしてニュースサイトやテキストメインのWebサイトでは必ず「読み上げボタン」が設置されて、クリック(タップ)するとマークアップを踏まえて一連のテキストが読み上げられるようになってほしいです。

もちろん記事の書き手は読み上げが怪しい箇所に対してことごとくタグ付けする必要があります。どのエンジンでも同じように読み上げさせるのは大変だけど、ある程度までは作業を半自動化できるでしょう。

これ、地道な作業だけど将来に向けて大事なステップだと思うのですよね。例えば2001年宇宙の旅のHAL 9000やスタートレックのコンピュータを実現するためには避けて通れないだろうと。

しかも現存するテクノロジー水準でも仕様を策定して音声読み上げエンジンとWebブラウザのメーカーが対応してくれさえすれば割とあっさり実現できそうな気がするし。