2015年4月11日土曜日

疾患別医師暴言指数

グーグルの検索結果数分析を用いて、疾患別の医師暴言指数を割り出した。これは、ツイッター選挙の技術確認ができたので、線維筋痛症の人気病院ランキング、または、不人気病院ランキングを啓発デーに向けて実施するかどうか、検討するために行った予備調査である。

まず、医師暴言指数ということで適切かどうか、キーワード別に比較する。すべて4月11日の検索結果である。

 "ドクハラ" "線維筋痛症"
  約 1,920 件

 "医師" "暴言" "線維筋痛症"
  約 10,400 件

ドクハラよりも医師暴言の方が統計的に有利であるため、医師暴言を採用する。

 "線維筋痛症"
  約 404,000 件

 10 400 / 404 000 =0.02574257425

したがって、線維筋痛症の医師暴言指数は2.6%である。しかし、この結果は、医師暴言と疾患名を共起させた検索結果数の統計精度に依存し、しかも文脈を問わず検索結果に含まれているため、おおざっぱな傾向しか示さないことに注意されたい。そうであるにしても、何もデータがなくて定量的に比較できないよりは、よほどまともな手法のはずである。

この結果を、以下のように略記する。

 "医師" "暴言" "線維筋痛症" 約 10,400 件 / "線維筋痛症" 約 404,000 件 = 2.6%

引き続いて別の疾患について同様に調べる。

 "医師" "暴言" "糖尿病" 約 166,000 件 / "糖尿病" 約 50,400,000 件 = 0.33%
 "医師" "暴言" "慢性疲労症候群" 約 18,600 件 / "慢性疲労症候群" 約 511,000 件 = 3.6%
 "医師" "暴言" "リューマチ" 約 2,820 件 / "リューマチ" 約 213,000 件 = 1.3%
 "医師" "暴言" "自閉症" 約 54,400 件 / "自閉症" 約 1,820,000 件 = 3.0%
 "医師" "暴言" "ダウン症" 約 264,000 件 / "ダウン症" 約 2,540,000 件 = 10%
 "医師" "暴言" "膠原病" 約 57,800 件 / "膠原病" 約 685,000 件 = 8.4%
 "医師" "暴言" "花粉症" 約 91,700 件 / "花粉症" 約 13,600,000 件 = 0.67%

膠原病が出てきた時点で、少し怪しくなってきたので、花粉症といった診断しやすい知られた疾患で指数が小さくなることを確認した。順位で並べてみる。

ダウン症>膠原病>慢性疲労症候群>自閉症>線維筋痛症>リューマチ>花粉症>糖尿病

ダウン症と自閉症は、特に若くして始まる疾患なので、とりあえず除くと、やはり線維筋痛症の2.6%は比較的高いほうだが、よく似た統計精度のよく似た疾患の中では、慢性疲労症候群の方が酷い。いずれにしても、両者ともに、糖尿病よりも10倍ちかく、"医師""暴言"が多い。ひいては糖尿病よりも10倍、医師による暴言が多いのであろうと推測される。

しかし、ここで、やはり本当に10倍程度で済んでいるのだろうか? 本当はグーグル検索のベイズエンジンのチューニングで実態より低めに出ているのではないだろうかという疑問が浮かぶ。この辺りが簡易的な検索結果数分析の限界なのでしょう。

ツイッター選挙だと投票者が公開されてしまうため、非公開のtwtpollの方で、病院不人気ランキングを実施することは可能だが、キャンペーン盛り上げるためにそこまでやって、キャンペーンページからのリンク許可を、遅れながらもとろうとしている学会から、無視を決め込まれてしまうというのも・・・まずいよね。誰かやってくれんかなっ・・と、思うけど・・・。

追記:よく考えたら、全く同じ手法で、病院別の医師暴言指数も計算できるはず。実行に移すかどうかは、よくよく考えないといけないけど。

0 件のコメント:

コメントを投稿