<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
     xmlns:content="http://purl.org/rss/1.0/modules/content/"
     xmlns:itunes="http://www.itunes.com/DTDs/Podcast-1.0.dtd">
  <channel>
    <title>如是我聞</title>
    <link>http://ohkuma.goga.co.jp/</link>
    <description>株式会社ゴーガのデータ分析／モデル分析研究員のブログです。</description>
    <language>ja</language>
    <docs>http://blogs.law.harvard.edu/tech/rss</docs>
    <itunes:subtitle></itunes:subtitle>
    <itunes:summary>株式会社ゴーガのデータ分析／モデル分析研究員のブログです。</itunes:summary>
    <itunes:keywords></itunes:keywords>
    
    <itunes:author>ohkuma2300</itunes:author>
    <itunes:owner>    
       <itunes:name></itunes:name>
       <itunes:email></itunes:email>
    </itunes:owner>
        <itunes:explicit>no</itunes:explicit>
        <item>
      <link>http://ohkuma.goga.co.jp/article/217615915.html</link>
      <title>超能力と統計分析 (2)</title>
      <pubDate>Sun, 31 Jul 2011 11:09:08 +0900</pubDate>
            <description>＊ずいぶんと時間が経ってしまいましたが（すいません！＞＜）、「超能力と統計分析」の後半にいってみたいと思います。前回の最後にご紹介したカイ二乗検定ですが、これは、「ある現象が偶然起きたのか」を判断するのに使われる最もポピュラーな手法で、統計学の教科書ではけっこう最初の方に出てきます。ようするに、それだけ（学問の世界では）広く信頼されている方法なので安心してください、ということなのですが（苦笑）、それでも信用できないという方がいたら統計学の本やネットの検索で調べてみてください。..</description>
            <content:encoded><![CDATA[
<font color=red>＊ずいぶんと時間が経ってしまいましたが（すいません！＞＜）、「超能力と統計分析」の後半にいってみたいと思います。</font><br /><br />前回の最後にご紹介した<font color=red><B>カイ二乗検定</B></font>ですが、これは、「<font color=red><B>ある現象が偶然起きたのか</B></font>」を判断するのに使われる最もポピュラーな手法で、統計学の教科書ではけっこう最初の方に出てきます。ようするに、それだけ（学問の世界では）広く信頼されている方法なので安心してください、ということなのですが（苦笑）、それでも信用できないという方がいたら統計学の本やネットの検索で調べてみてください。<br /><br />さて、<B>難しい理屈は飛ばしてしまいましょう</B>。カイ二乗検定をちゃんと理解するには、カイ二乗分布、標準正規分布、自由度、期待値、帰無仮説、有意水準、独立分布などを説明しなくてはなりませんが、きっと読者はそんなこと求めてない（笑）。ここで読者の多くが知りたいのは「本物の超能力者を見分ける方法」でしょうから。<br /><br />というわけで、カイ二乗検定の使い方です。まず、コイン当てをある程度の回数やってから、次の X を計算してみてください。<br /><br /><B>X＝｛（当り回数－偶然当たる回数）の2乗/偶然当たる回数｝＋｛（外れ回数－偶然外れる回数）の2乗/偶然外れる回数｝</B><br /><br />例えば、コイン当てを<B>100回</B>やって<B>56回</B>の当たりを出したとしましょう。その場合、「<B>当り回数</B>」は56回、「<B>外れ回数</B>」は（100回－56回）＝44回になります。「<B>偶然当たる回数</B>」は、前回ご説明したように、偶然当たる確率が50％なので 0.5（50％）×100回＝ 50回 です。「<B>偶然外れる回数</B>」は、（100回－偶然当たる回数）なのでやはり50回です。すると X は、<br /><br /><B>X＝｛（56－50）の2乗/50｝＋｛（44－50）の2乗/50｝</B><br /><br />なので、<B>X=1.44</B> となります。ちなみに、X のことを「カイ自乗統計量」と言います。<br /><br />次に EXCEL を使います。EXCEL には <B>CHIDIST関数</B> という便利な機能があるので、どのセル（マス目）でもいいですから、次のように書き込んでみてください（*2）。<br /><br /><B>=CHIDIST(X,1)</B><br /><br />56回の当たりが出た上の例では X=1.44 でしたから、セルの中には“=CHIDIST(1.44,1)”と書き込めばいいわけです。すると、だいたい <B>0.23</B> という計算結果が出てきます。これが何を表しているかというと、実は「<font color=red><B>56回の当たりが偶然出た確率</B></font>」なのです。だから、100回中56回の当たりが偶然出る確率は <B>23%</B> ということになります。ちなみに、100回のコイン当てなら、<B>63回</B>の当たりを出せばこの確率は 約0.93% まで下がります。つまり 1% 以下ですから、逆に言うと「<font color=red><B>99%以上の確率で偶然の結果ではない</B></font>」と言えることになるのです。<br /><br />もちろん、「<B>偶然の結果ではない</B>」というだけのことですから、<B>インチキ</B>や<B>不正</B>をやっても同じ結果は出せてしまいます。だから、この辺がどうも統計学の限界だと言えそうです。インチキや不正を暴くのは、TVで活躍する反オカルトの科学者先生やマスコミの記者さん達に任せることにします。<br /><br />とはいえ、「<B>遊び</B>」として友達に目の前でやってもらうのなら、インチキや不正がないかは存分に調べられますし、コインやコインを投げる人もこっち側で準備すれば、インチキや不正の心配もほとんどなくなりますよね。ということで、<font color=red><B>皆さんもパーティなどで試してみてはいかが？</B></font><br /><br />私が前にやってみた経験から言うと、100回ぐらいならば63回以上当たりを出す人（つまり「<B>偶然の範囲</B>」を超えて当たりを出した人）もごくまれに出てくるようです。でも、200回、300回、と実験を重ねていくうちに、しまいには<font color=red><B>全員が「偶然の範囲」におさまってしまう</B></font>でしょう。なんなら、必ずそうなると<font color=red><B>断言</B></font>してもかまいません。<br /><br />なぜなら、<B>2000回</B>の実験でこの「<B>偶然の範囲</B>」を突破しようとするなら、上で紹介した計算をやり直してみると <B>約53%</B> の正答率（1058回以上の当たり）を出すだけで良いことがわかりますが、この程度のハードルでさえ、今までに越えられた人は<font color=red><B>ただの一人もいない</B></font>からです。<br /><br />少し傲慢な言い方をしてしまったかもしれませんが、いつか私の鼻っ柱をへし折ってくれるような本物の「超能力者」が現れてくれることを祈っています。<br /><br />*2 　EXCELを使わないと、この計算はとても大変なので、ここではEXCELを使った方法だけを紹介します。<a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                </item>
        <item>
      <link>http://ohkuma.goga.co.jp/article/169832040.html</link>
      <title>超能力と統計分析 (1)</title>
      <pubDate>Thu, 18 Nov 2010 17:31:38 +0900</pubDate>
            <description>今日はちょっと趣向を変えて「超能力」をとり上げたいと思います。といっても、あくまで統計分析の観点から、です。あらかじめお断りしておきますが、「超能力は存在するか？」という問題にここで結論を出すことはしません。例えば、コインを投げて裏か表かを当てるゲームをするとしましょう。もしこのゲームを100回やって100回当たれば、当てた人は「超能力者である」と認めていいものでしょうか？　もしインチキや不正の類いが一切ないと仮定すれば（*1）、大抵の人は認めても良いと思うのではないでしょう..</description>
            <content:encoded><![CDATA[
今日はちょっと趣向を変えて「<font color=red><b>超能力</b></font>」をとり上げたいと思います。といっても、あくまで<b>統計分析の観点から</b>、です。あらかじめお断りしておきますが、「超能力は存在するか？」という問題に<b>ここで結論を出すことはしません。</b><br /><br />例えば、<font color=red><b>コイン</b></font>を投げて<b>裏</b>か<b>表</b>かを当てるゲームをするとしましょう。もしこのゲームを100回やって<b>100回当たれば</b>、当てた人は「<font color=red><b>超能力者である</b></font>」と認めていいものでしょうか？　もしインチキや不正の類いが一切ないと仮定すれば（*1）、大抵の人は認めても良いと思うのではないでしょうか。<br /><br />しかし、とても<b>疑り深い人</b>だったら こう言うかもしれません、「<font color=red><b>100回の当たりくらい、偶然に起きることだってある</b></font>」。これは本当でしょうか？　100回のうち<b>100回当たり</b>なんて現象が、そうそう偶然起こるものでしょうか？　……そんな極端なケースの場合は、ちょっと「疑り深い人」に分が悪いようですね。<br /><br />ですが、100回のうち<b>90回当たり</b>だったらどうでしょうか？　それでも<b>偶然はない</b>と言い切れますか？　100回中<b>80回</b>なら？　<b>70回</b>なら？　ほら、だんだん「<b>疑り深い人</b>」に賛同する人が増えてきたのではないでしょうか。　さて、<b>60回</b>ならどうでしょう？　<b>50回</b>だったら……これは<b>偶然と言えそう</b>ですね。<br /><br />偶然にまかせてコイン当てをしていれば、1回のコイン投げで裏表を当てる<font color=red><b>確率</b></font>は<b>50％（0.5）</b>になります。それは次のような理由からです。この場合の確率は「<b>コイン投げの裏表を前もって予想する</b>」と「<b>コインを投げる</b>」という2つの現象の組み合わせから決まります。つまり｛コイン投げの予想，コイン投げの結果｝で1セットということですが、この組み合わせは｛表，表｝｛表，裏｝｛裏，表｝｛裏，裏｝の<b>4セット</b>で全てです。このうち、当たりである組み合わせは｛表，表｝と｛裏，裏｝の<b>2セット</b>だけですから、当たる確率は<font color=red><b>（2セット／4セット）＝（1/2）＝0.5</b></font>ということになります。<br /><br />理屈の上では、偶然当たる確率が50％のコイン投げを100回やった時の「<b>当たる回数</b>」は、0.5（50％）×100回＝ <font color=red><b>50回</b></font>になります。だから100回中50回の当たりなら、「<b>偶然だ</b>」と言っても良さそうなわけです。<br /><br />しかし自然界の現象には必ず「<font color=red><b>誤差</b></font>」というものが付きまといますから、むしろ毎回<b>きっかり50回当たる</b>という方が<b>現実には無さそう</b>です。だから当たりの回数が<b>48回</b>（誤差：-2回）や<b>53回</b>（誤差：+3回）であったとしても、「<b>偶然ではない</b>」とは言い切れないでしょう。それでは、<font color=red><b>誤差の大きさというのは一体どこまで認められるものなのでしょうか？</b></font>　当たりの回数が<b>60回</b>（誤差：+10回）までは誤差の範疇でしょうか？　極端なことを言えば、誤差が<b>+50回</b>まで認められるのならば、先ほどの「疑り深い人」が言った、「<b>100回全部が偶然に当たることだってある</b>」という意見だって<font color=red><b>認められてもいい</b></font>んじゃないでしょうか？<br /><br /><font color=red><b>どこまでが偶然による誤差なのか？</b></font>　それを判断するのにとても便利な統計分析法があります。それは<font color=red><b>カイ二乗検定</b></font>という手法なのですが、次回はそのやり方（<b>誰にでもできます！</b>）をご説明したいと思います。<br /><br /><br />*1 　現実の超能力真贋論争ではここが一番重要視されたりしますが、その事には後（次回以降）で触れるので、ひとまずこう仮定しましょう。<a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                </item>
        <item>
      <link>http://ohkuma.goga.co.jp/article/163299837.html</link>
      <title>統計データ分析の将来</title>
      <pubDate>Tue, 21 Sep 2010 10:35:44 +0900</pubDate>
            <description>最初に私個人の結論を書いておくと、統計データ分析は今後、一大産業にまで発展すると考えています。以前のエントリで、統計データ分析の効用は何よりも「確かめる」ことにあると書きました。ビジネスの世界では最近、経営リスクを減らす武器として統計データ分析（＝「確かめる」）の重要性が再認識されています。今後、ビジネス界での統計データ分析の需要は、IFRS（国際財務報告基準）の導入も追い風となってますます大きくなっていくでしょう。しかし、統計データ分析が産業化するには需要だけでは足りません..</description>
            <content:encoded><![CDATA[
最初に私個人の結論を書いておくと、<span style="color:#FF0000;"><strong>統計データ分析は今後、一大産業にまで発展する</strong></span>と考えています。<br /><br /><a href="http://ohkuma.goga.co.jp/article/161666417.html" style="color:blue"><u>以前のエントリ</u></a>で、統計データ分析の効用は何よりも「<strong>確かめる</strong>」ことにあると書きました。ビジネスの世界では最近、経営リスクを減らす武器として統計データ分析（＝「確かめる」）の重要性が再認識されています。今後、<ins>ビジネス界での統計データ分析の<strong><span style="color:#FF0000;">需要</span></strong>は、IFRS（国際財務報告基準）の導入も追い風となって<strong>ますます大きくなっていくでしょう</strong></ins>。<br /><br />しかし、統計データ分析が<strong><span style="color:#FF0000;">産業化</span></strong>するには<strong>需要</strong>だけでは足りません。例えば、製造業が日本の主要産業に発展するには、製品の<strong>需要</strong>だけではなく<strong><ins>安定した<span style="color:#FF0000;">原料</span>の供給</ins></strong>が必要でした。では、統計データ分析の<strong>原料</strong>は今後も安定供給されるのでしょうか？<br /><br />統計データ分析の<strong>原料</strong>は言うまでもなく<strong>データ</strong>ですが、それが情報としての価値を持つためには、分析によって<ins><strong>加工</strong>（集計・解析）</ins>されなくてはなりません。しかし、いったんデータから<strong>加工</strong>されて<strong>広く周知</strong>されてしまうと、<strong>情報としての価値は著しく低下</strong>します。ですので、産業化のためには<ins>多くの人が<strong>未知</strong>で、<strong>未加工</strong>のデータが日々<strong>大量</strong>に供給されなくてはなりません</ins>。そんな手付かずの、<strong>データの鉱脈</strong>が果たしてあるのでしょうか？<br /><br /><strong>実はあるのです</strong>。これは大企業の経理畑の方に聞いた話なのですが、長い歴史を持つ大企業の<strong>資料庫</strong>には、そんな<ins><strong>手付かずの膨大なデータ</strong></ins>が眠っているそうです。ところが、<strong>これが今は有効利用されていない</strong>。なぜか？　それは、その<ins><strong>データが<span style="color:#FF0000;">紙</span>に書かれた形で保存されている</strong></ins>からです。これは企業だけでなく、<strong>官公庁でも同様</strong>だと聞いています。私は、これらが分析されないままに眠っているのは<strong><ins>大変にもったいない</ins></strong>ことだと思っています。もっとも、「そんな古いデータに情報価値はない」とおっしゃる方もいます。しかし、<ins>その時代に固有な社会状況やデータ収集上の制約（技術の未発達等）については、それらの影響を可能な限り取り除く（コントロールする）分析方法が統計学にはあります</ins>。だとしたら、<strong>過去と同じような問題に直面した場合の状況分析</strong>として、十二分に有効な手段となり得るでしょう。そんな、知の宝庫ともいえる休眠データの付加価値が解き放たれたとき、一体どれほどの<strong>社会的利益</strong>がもたらされるか。<br /><br />一方、コンピュータ化された<strong>ネット社会</strong>では、<strong><ins>日々<span style="color:#FF0000;">膨大な量のデータが新規に創出</span>されています</ins></strong>。一企業だけでも、毎日数十～数百万件のオーダーで取引データが発生する、という状況も決して珍しくありません。ところが、<strong>これも決して有効活用されているとはいえない</strong>。むしろ、企業は日々の情報洪水をさばくことだけで精一杯で、分析することもないまま<strong>巨大な記憶装置にデータを眠らせている</strong>ことも多いのが現状です。これも、<strong><ins>きちんと分析して付加価値を生み出せば巨大な利益を生む</ins></strong>でしょう。<br /><br /><ins>あとは、データ分析を大規模に行うための<strong><span style="color:#FF0000;">追加投資</span></strong>と<strong><span style="color:#FF0000;">分析要員の確保</span></strong>で<strong>産業化</strong>は成ります</ins>。<strong>投資</strong>については、実際に統計データ分析でリスクを減らして競争力を増す企業や組織が出てくれば（実際にIT企業や金融機関ではもう出始めています）<ins<strong>追随者</strong>が積極的に追加投資を行うことでしょう</ins>。<strong>分析要員</strong>については、実は最近、<ins>統計分析のスキルを持つ<strong>人材の裾野が徐々に拡大</strong>しつつあります</ins>。というのは、<strong>R</strong>のようなオープンソース型の統計分析ソフトの普及によって、<ins><strong>EUC</strong>（エンド・ユーザー・コンピューティング）的に統計データ分析に関わるユーザーが増えている</ins>のです。この流れは、統計ソフトウェアが、よりユーザーフレンドリーで、よりオープンな方向に発展していくことで、<strong>ますます加速していくでしょう</strong>。つまり、<ins>ただ単に統計データ分析をしてもらう「<strong>お客さん</strong>」の立場から、「<strong>分析者</strong>」の立場、あるいは<strong>その中間的な立場</strong>へとシフトする人が増えているので、<strong>分析要員の確保</strong>も、これまでよりは<strong>比較的楽</strong>になるということです</ins>。<br /><br />そんなわけで、統計データ分析が産業化していくことは間違いないと思います。問題は、<ins><strong>それが<span style="color:#FF0000;">日本</span>で起こるかどうか</strong></ins>なのですが、<strong>日本の統計学</strong>は<strong>赤池弘次</strong>博士のような世界レベルの研究者を輩出するほどの水準を誇っているので、<ins><strong>素養は十分にある</strong></ins>と思います。あとは、<ins><strong>勇気ある経営者</strong>の方が、目の前に転がっている「統計データ分析の産業化」という<strong><span style="color:#FF0000;">ビジネスチャンス</span></strong>に手を伸ばす</ins>、つまり<strong>資金を投資</strong>すれば、日本企業は来るべき<strong>統計データ分析産業</strong>で<strong><span style="color:#FF0000;">リーダー</span></strong>となり、大きな<strong>開拓者利益</strong>を享受できるでしょう。<a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                </item>
        <item>
      <link>http://ohkuma.goga.co.jp/article/162475230.html</link>
      <title>統計データ分析は、大きく２つに分けられます</title>
      <pubDate>Mon, 13 Sep 2010 10:41:11 +0900</pubDate>
            <description>統計データ分析とは「確かめる」ことだ、というのを前回では説明しました。ところで、ここでいう「確かめる」は、目的によって2種類に分けられます。1種類目は「どうなってるのかを確かめる」で、2種類目は「自分の考えが正しいかを考える」です。1種類目の目的のために使用される統計データ分析手法のグループを「ファクトファインディング（事実発見）系」、2種類目の目的のために使用される分析手法のグループを「仮説検証系」と呼ぶことにしましょう。すると、それぞれのグループには、だいたい次のような分..</description>
            <content:encoded><![CDATA[
統計データ分析とは「<strong>確かめる</strong>」ことだ、というのを<a href="http://ohkuma.goga.co.jp/article/161666417.html" style="color:blue"><u>前回</u></a>では説明しました。ところで、ここでいう「確かめる」は、目的によって2種類に分けられます。1種類目は「<ins><strong>どうなってるのかを確かめる</strong></ins>」で、2種類目は「<ins><strong>自分の考えが正しいかを考える</strong></ins>」です。1種類目の目的のために使用される統計データ分析手法のグループを「<strong>ファクトファインディング（事実発見）系</strong>」、2種類目の目的のために使用される分析手法のグループを「<strong>仮説検証系</strong>」と呼ぶことにしましょう。すると、それぞれのグループには、だいたい次のような分析手法が含まれます。<br /><br /><strong>ファクト･ファインディング（事実発見）系</strong>：<br />　記述統計，クロス集計，分散分析，因子分析，クラスター分析etc<br /><br /><strong>仮説検証系</strong>：<br />　重回帰分析，時系列分析，ﾛｼﾞｯﾄ/ﾌﾟﾛﾋﾞｯﾄﾓﾃﾞﾙ，パネル分析etc<br /><br />　それでは、ビジネスに統計データ分析を使う場合、どちらのグループが必要になるでしょうか？　その答えは、両方です。<br /><br />通常、統計データ分析のプロセスは次のようにして行います。まず、注目している経済現象(*1)が<ins>「どうなっているのか」について正確な情報を掴むため</ins>、ファクト・ファインディング系の分析を行います。次に、その分析結果が示す事実をもとに<ins>「こうなった原因は何なのか？」を考えます</ins>(*2)。そして、<ins>「原因は何か？」についての「自分（なり）の考え」</ins>(*3)がまとまったら、<ins>「それが正しいかどうか」を仮説検証系の分析によってチェックします</ins>。<br /><br /><img src="http://ohkuma2300.up.seesaa.net/image/img01.jpg" width="482" height="117" border="0" align="" alt="img01.jpg" onclick="location.href = 'http://ohkuma.goga.co.jp/upload/detail/image/img01.jpg.html'; return false;" style="cursor:pointer;" /><br /><br />ただし、実際のビジネスでは、<ins>必ずしもファクト・ファインディング系と仮説検証系がペアで使われるとは限りません</ins>。例えば、業務の効率改善を行うために業務監査を行ったとします。この場合、生産性が低く非効率な業務をリストアップするためにファクト・ファインディング系の分析が使われますが、クライアントから特に追加的な指示がない限り、ここで監査は終了です。しかし、クライアントから「監査結果をもとに改善策を提案してほしい」というような要望があった場合は、自らが提案する改善策(*4)が有効であるかどうかを検証するために仮説検証系の分析が使われます。つまり、<ins>実用面においては、時と場合によって使い分けることも重要です</ins>。<br /><br />*1　会社や世帯の収入や支出、人員構成、間接費や直接費等の費用、組織体制、など。<br />*2　個別事例から原因を考えることを「帰納的推論」と言います。<br />*3　これが、統計データ分析における「仮説」です。<br />*4　非効率の「原因」を取り除くことができるアイデア<br /><a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                  <enclosure url="http://ohkuma2300.up.seesaa.net/image/img01.jpg" length="25304" type="image/jpeg" />
                            </item>
        <item>
      <link>http://ohkuma.goga.co.jp/article/161666417.html</link>
      <title>なぜビジネスに統計データ分析が必要なのでしょうか？</title>
      <pubDate>Sun, 05 Sep 2010 22:41:39 +0900</pubDate>
            <description>例えば、経営上の意思決定をしなくてはならない場面で、A案とB案という選択肢があったとします。もしも、過去の実績でA案が6割2分の成功率、B案が6割7分の成功率だったとすると、やはり少しでも成功率の高いB案を選ぶべきなのでしょうか？　もしこれが、A案が1割でB案が9割のような明確な差であったならば、どちらかを選ぶのに迷う人はほとんどいないでしょう(*1)。でも、6割2分と6割7分というのでは、あまりにも微妙ですよね？　そんな時、この微妙な差がたまたま生じた(*2)ものなのか、そ..</description>
            <content:encoded><![CDATA[
例えば、経営上の意思決定をしなくてはならない場面で、A案とB案という選択肢があったとします。もしも、過去の実績で<strong>A案が6割2分</strong>の成功率、<strong>B案が6割7分</strong>の成功率だったとすると、<ins>やはり少しでも成功率の高いB案を選ぶべきなのでしょうか？</ins>　もしこれが、<strong>A案が1割</strong>で<strong>B案が9割</strong>のような明確な差であったならば、どちらかを選ぶのに迷う人はほとんどいないでしょう(*1)。でも、6割2分と6割7分というのでは、あまりにも<strong>微妙</strong>ですよね？　そんな時、<ins>この微妙な差がたまたま生じた(*2)ものなのか、それとも何か意味がある差(*3)なのかを、統計データ分析を使えば確かめることができる</ins>のです。<br /><br />このケースに限らず、統計データ分析一般の効用は、この「<ins><strong>確かめる</strong></ins>」という一言に集約することができます。ところで、「確かめる」というのは、言い換えれば「<strong>不確実性を低くする</strong>」ということですし、「不確実性」はビジネス用語で言えば「<strong>リスク</strong>」ですよね。ということは、つまり、<ins>統計データ分析を行えばビジネス上のリスクを低減させることができる</ins>、と言えるわけです。経営者にとって、自社ビジネスのリスクを取り除くのは当然のことですよね？　だから統計データ分析はビジネスに必要なんです。<br /><br />*1　本当は、その場合でも様々な考慮が必要なのですが……<br />*2　偶然生じた<br />*3 「有意差」または「統計的に有意な差」といいます<br /><a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                </item>
        <item>
      <link>http://ohkuma.goga.co.jp/article/161208917.html</link>
      <title>はじめまして！</title>
      <pubDate>Wed, 01 Sep 2010 13:29:03 +0900</pubDate>
            <description>株式会社ゴーガに9月1日、つまり今日入社したばかりの新入社員（といってもキャリア採用）です。簡単に自己紹介をさせていただきます。名前は、大隈 慎吾（オオクマ シンゴ）といいます。現職は、株式会社ゴーガの データ分析/モデル分析研究員 です。前職は、民間シンクタンクの、やはり研究員でした。専門は、社会現象のコンピュータ・シミュレーションと統計データ分析です。コンピュータ・シミュレーションの中でも特に私が得意なのはMAS（マルチ・エージェント・シミュレーション）なのですが、これは..</description>
            <content:encoded><![CDATA[
株式会社ゴーガに9月1日、つまり今日入社したばかりの新入社員（といってもキャリア採用）です。<br /><br /><br />簡単に自己紹介をさせていただきます。<br /><br />名前は、大隈 慎吾（オオクマ シンゴ）といいます。<br />現職は、株式会社ゴーガの データ分析/モデル分析研究員 です。<br />前職は、民間シンクタンクの、やはり研究員でした。<br />専門は、社会現象のコンピュータ・シミュレーションと統計データ分析です。<br /><br /><br />コンピュータ・シミュレーションの中でも<br />特に私が得意なのはMAS（マルチ・エージェント・シミュレーション）なのですが、これは、シンプルな行動ルール（例えば、「隣りに敵がいれば攻撃し、いなければ隣りに移動する」など）だけを与えたエージェント（仮想的な行動者）をコンピュータの中にたくさん作り、その行動ルール通りに動かした結果、集団全体としてどんな現象が起こるかを観察するものです。<br /><br />最近では、MASはハリウッド映画でも使われています。例えば、広大な戦場を無数の兵士が行き交う合戦シーンのリアルなCG（コンピュータ・グラフィック）をご覧になったことはないでしょうか？　このCGの兵士１人１人を動かしているのがMASなのです。<br /><br />MASの他にも、GTAPやGAMSなどのCGE（応用一般均衡モデル）シミュレーションや、マイクロ・シミュレーションなども得意としています。<br /><br /><br />統計データ分析については、計量経済学（統計学を使った経済学の実証研究分野）の範ちゅうに含まれるものなら、できないものはほとんどありません。<br />具体的には、分散分析、因子分析、主成分分析、判別分析、クラスター分析、コレスポンデンス分析、デシジョン・ツリー、重回帰分析、順序回帰分析、カテゴリカル回帰分析、ロジットモデル、プロビットモデル、対数線形分析、ロジット対数線形分析、一般線型モデル、時系列モデル（ARモデル，MAモデル，ARMAモデル等）、単位根検定、VARモデル、グランジャーの因果検定、インパルス反応分析、パネル分析、クロスセクション分析、コンジョイント分析、共分散構造分析、テキストマイニング等ができます。<br /><br /><br />ところで、統計データ分析というのはビジネスで決定的な役割を果たすことができる強力な武器だというのに、あまりそのことが世間では認知されていないように思うんです。なので、次の記事から、その辺りのことを書いていきたいと思っています。例えば、「そもそも何でビジネスに統計データ分析が必要なのか」から始まって、最終的には「こういうビジネス・シーンには、この分析方法が有効！」という個別具体例まで示せたらいいですね。<br /><br /><a name="more"></a>

]]><![CDATA[
]]></content:encoded>
            <category>日記</category>
      <author>ohkuma2300</author>
                </item>
      </channel>
</rss>

