読みやすさの公式

 こうやって日記を書いていて、読んでいて何を言っているのかわからない…という文章は書かないように心がけてはいます*1。少なくとも読みやすい文であればなあと思っているわりには、時々自分でも満足できない言い回しが多い日もあり、言葉は難しいと本当に思えます。
 この読みやすさという点に関して、かつてアメリカで文章のreadabilityの研究がなされたことがありました。現在それを知る人が少ないところから見て、それが本当に使えるものであったかには疑問が残りますが、考え方としては頷かせるものを持っています。
 デールとチャールの公式

 Dale-Chall Readability Index

 R = 0.0496a + 0.1579b + 3.6365

(R:読み難さ a:一文の平均の長さを語数で表したもの b:難しい語彙)

 文が長ければ係り受けが見えづらく読み難くなる。言葉が難しくても読みやすさが低下する。
 まあ発想はわかり易い公式なんですが、流行らなかったのはやはり面倒くさいからでしょうか。初出は1948年の論文、Dale, E., & Chall, J.S. (1948). A formula for predicting readability. Educational Research Bulletin, 27, 37-53. となっています。戦後間もなくのものですね。
 a の求め方は語数をセンテンス数で割るという簡単なものですが、b の方はどうやらDale氏が作った"difficult words"なるリストに載っている語の数から求められるようで、このチェックが1948年当時は非常に面倒だったのではないでしょうか。もちろんこの部分を変えられるということは時代についていくために有効な手法ではあると思うのですが…


 同じような感じでフレッシュの公式というのもあるそうで、こちらの方は

 The Flesch Formula

  e = 206.835 - (1.015x + 0.846y)

(e:易しさ(easiness) x:文の平均語数 y:語の長さ(文節数))

 となっているようです(参考 pdf
 確かに長い語は往々にして難しい語となります。日本語の感覚でも、長い語と言えば漢語調で「〜的」とかいう語が多く入った面倒くさい語になりがちですから、こちらもわかるような気がします。
 上記参考urlではその後のこうしたReadability研究の方にも触れられていますが、全部読むのも大変なので紹介はこのぐらいで…


 こうした公式のアイディアを利用して日本語で考えて一度作ってしまえば、その適用は今やプログラムで簡単に出せそうなので、どなたか試みてはいかがでしょうか? もっとも問題は、短い文で平易な言葉を使いつつ何を言っているのかわからない文章に結構出会ってしまうもの、というあたりにもありそうですが…

*1:意識だけなのかもしれませんが…orz