中心極限定理をめぐる誤解

中心極限定理。統計を使う研究に身を置く人であれば、一度は聞いたことがあるであろう。 はて、その意味するところはなんだろうか? 「サンプルサイズ(標本数)が増えれば、どんな確率変数も正規分布で近似できる」 たぶん、生態学の界隈では、このような理解がまことしやかに蔓延っている(昔私も信じていた)。その結果としてこういった記述をみることがある。 「応答変数は個体数であるが、サンプル数が多いことから正規分布で近似する」 結論から言うと、できません。さて、どこが間違ってるのだろうか。 わかりやすい説明を試みるが、自信はない。 Rで試す中心極限定理 統計の表現になれのない人のために、表現について少し解説を加えておく。ここでは、正規分布ではない確率分布として、ポアソン分布を例に挙げようと思う。確率変数1がある確率分布に従うとき、それはニョロニョロ(Tilde, ~)をつかって表現される。例えば、確率変数Xが平均2のポアソン分布に従う場合、次のように書く: \[ X \sim \text{Poisson}(2) \] 試しにRでXを生成してみる(rpois()はポアソン分布に従う乱数を生成)。 # produce 3 samples of X that follows a Poisson distribution with a mean 2 (X <- rpois(n = 3, lambda = 2)) ## [1] 1 2 2 この例では、3サンプル生成してみると、1, 2, 2 となった。ここで、最初の文言に戻ってみよう。 「サンプルサイズ(標本数)が増えれば、どんな確率変数も正規分布で近似できる」 この言葉を字面通りに受け取ると、サンプルをどんどん増やしていけばXはいずれ正規分布に近づくように解釈できる。もしそうならば、サンプル数を増やすほど、Xの頻度分布はきれいな左右対称の鐘状になるはずだ。試してみよう。まずは100サンプル。 # histogram with 100 samples X <- rpois(n = 100, lambda = 2) plot(table(X)) うーん、歪んでいる。1万ならどうだ。 # histogram with 10000 samples X <- rpois(n = 10000, lambda = 2) plot(table(X)) そろそろわかると思うが、Xのサンプルサイズを増やしたところでXはポアソン分布のままである。そう、中心極限定理は、そもそもこんなことは言っていないので当然である。...

December 16, 2024 · Akira Terui

RでGIS:ラスター

RでGIS terraによるラスター処理 データの読み込み ベクターレイヤと組み合わせる crop() :必要な部分のみ切り抜く exact_extract() :ポリゴンごとに値を集計 最後に RでGIS 先日、RでのGIS作業にむけた簡単なポスト(RでGIS:ベクター)を書いた(最近だと思っていたが実に二年以上たっている事実に驚愕)。今回はそのフォローアップとして、ラスターデータの取り扱いについても簡単に紹介してみたい。今回はsf、terra、exactextractr、tmapの4つを使うので、先にこれらを読み込んでおく。 pacman::p_load(sf, terra, exactextractr, tmap, tidyverse) terraによるラスター処理 Rによるラスターデータの解析は長らくrasterパッケージが使われてきたようだが(私も初期はこちらを利用)、最近ではterraが主流になっており、ほかのGIS系パッケージとも互換性が確保されてきた様子(いくつか対応していないものもあるようだが、細かく把握していない)。terraのほうが圧倒的に計算速度が速いので、こちらの例を挙げる。 データの読み込み データの読み込みにはterra::rast()を使う。今回、ここで使うラスターファイルはCHELSAの気候データ(赤道付近で1km程度のメッシュ)。CHELSA_bio1_1981-2010_V.2.1.tif(1981-2010年の平均気温データ)のアメリカ、ノースカロライナ(NC)周辺を切り出し、.../static/gis/airtemp_nc.tifとして保存しておいた(Linkからダウンロード可能)。私はこのファイルパスを指定して読み込むが1、使用者は各自の保存先のパスを指定すれば読み込める。 # read data # here::here() is a function that returns an absolute path rs_air <- rast(here::here("static/gis/airtemp_nc.tif")) print(rs_air) ## class : SpatRaster ## dimensions : 325, 1064, 1 (nrow, ncol, nlyr) ## resolution : 0.008333333, 0.008333333 (x, y) ## extent : -84.32514, -75....

December 1, 2024 · Akira Terui

海外で働くということ

気が付いたら、アメリカで働き始めて6年以上経つ。 ときに「もう英語はすっかりペラペラなんですか?」と聞かれる。 もしかしたら、そうなのかもしれない。 だが、英語に対する劣等感が消えたことはないし、これから消えることもないと思う。 もともと海外志向が強いわけでもなく、受験以上の英語を積極的に勉強したわけでもない。 しかし、博士一年のときに初めて参加した国際学会のインパクトがすごかった。 日本のコミュニティーの閉鎖性を否応なしに突き付けられ、「受け身」のまま日本に居座ってはいけないと思い立った。 このとき25歳。 予算を確保し、アメリカに渡航したのは30歳のとき。 30歳を過ぎてから、言葉も文化も異なる国に順応するのはそれなりに辛い。 私の場合、日本から予算(海外学振)をいただいてアメリカにポスドクとして来た。 そして、2年のポスドク期間の後、幸いにも現在の職場でファカルティ―ポジション(教員)のオファーをいただけた。 当然、教員として「雇用」されたからには相応の能力が要求される。 自分の研究室の学生やポスドクの給料を支えられるだけ研究費を勝ち取らなければならない。 指導する学生とうまくコミュニケーションできなければならない。 授業をゼロから作り、平然とこなさなければならない。 これらを、Native相手に英語でやらなければいけない。 アメリカの教員としての常識を把握するには、2年というポスドク期間はあまりにも短い。 教員として働き始めた最初の一年は、数えきれないほどの「わからない」を、一つ一つ潰していく年だった。 研究費を申請する際の手続き・書類の量が段違いに多い。 そもそもどこからお金を引っ張ってくればいいのかわからない。 職員会議(教授会)に出ても、聞いたことのない英語略称が飛び回るので置いてけぼりをくらう。 そんな状況でも、論文の生産性を落としてはならない。 だが、教員としての3年目が始まる頃、仕事の感触がこれまでと異なるのを感じる。 英語でも相手の「人となり」がわかるようになる。 議論をリードすることがそれほど苦痛ではなくなる。 一つ不安が消えては新たな不安が出てくるが、とりあえず一つずつ克服することにした。 今、複数PIからなる研究プロジェクトをリードとしてプロポーザルを書いている。 20代半ばのころは、英語で予算交渉のような繊細なやりとりする羽目になるとは想像だにしなかった。 何とかなっているので、いろいろ何とかなるようだ。

September 8, 2023 · Akira Terui

「放流しても魚は増えない」について

先日、放流に関する論文("Intentional release of native species undermines ecological stability")を発表したところ、メディアに広く注目いただき、とてもうれしく、そして驚いてもいます。「放せば増える」という図式はとても直感的なため、それに反する結果がでたことに驚きを感じたのだろうと推察しています。一方、SNSなどで反応を見ていると、いくつか説明を補足したほうがいいだろうと思ったものがありました。これだけ反響があったことですし、誤解や拡大解釈があってもいけないので、2点取り上げようと思います。 外来種は増えている 「放流しても魚は増えない」に対する反応(あるいは反証)として最も大事だと感じたのは、「外来種は放流で増えている」というものでした。これはもっともな疑問かと思います。この点に関する私の見解は以下の通りです。 (1)外来種の放流は、水産重要種などの意図的な放流とは様式が全く異なる。外来種の放流は(意図されない)突発的なイベントであり、(公に)大規模かつ継続して行われることはまずないでしょう(ペットを逃がすなど1)。放すといっても多くて数百尾でしょう。このため、放流に伴う「過度の競争」は起きにくいと考えられます。もし、バスやギルを小さな池に毎年何万尾も放流すれば、「過度の競争」は起き、サクラマスに見られた「放流で減る」ようなことは起きると思います。もちろん、バスやギルが減る前に在来種がまず食い尽くされるわけですが。。。 (2)「外来種にとって」の器はからっぽ。もう一点異なるのは、受け手となる生態系にその種がいないことです(最初の導入であれば)。これは、外来種にとってみればガラガラのレストランに入るようなものです。例えば、在来種がワイワイと暮らす池に10匹のオオクチバスを放したとしましょう。在来種というご馳走がたんまりある上に、競争相手となる他のオオクチバスはたったの9匹しかいません。この状況で「過度の競争」が起きるわけがありません2。外来種の繁栄は、今回の結論の反証であるかのように見えますが、実は同じ現象を別の角度からみているに過ぎません(器が空いていれば、適度に放すと増える)。なので、むしろ論文の結論を支持しているといってもいいでしょう。地域絶滅した種の再導入を例に、同様の議論は過去のポストでも書いています。 忘れてならないのは、大半の外来種は「侵略的(増えすぎて問題になる)」ではない、という事実です。オオクチバスやブルーギル、アメリカザリガニのように増えて問題なっている外来種をみると、持ち込めば必ず増えると誤認しそうになります。しかし、実際のところ、ほとんどの外来種は定着できずに死に絶えることがわかっています3。これには持ち込まれた先の環境(非生物・生物含む)がその種に適していなかったためと考えられ、外来種研究の分野では何十年も前から言われている常識です。つまり、場が整わない限り生き物は増えない、という事実は何十年も前から突き付けられているのです。 放流≒ダメなこと? これは繊細な内容になりますが、今回の論文はすべての放流を否定するものではありません。放流が必要になるケースは確かにあります。地域絶滅した種を再導入したい場合はその一例でしょう。ほかにも、集団から遺伝的多様性が失われ、奇形が多くでてしまうような場合にも放流は必須でしょう。しかし、だからといって放流は環境破壊の免罪符にはならない、というのが一番大事な点になると思います。論文中の最後のパラグラフでは以下のように述べました: While socioeconomic analysis is required to provide detailed guidance on release programs, it is clear that habitat conservation should be prioritized for the sustainability of natural resources. Protected areas and environmental restoration are promising tools to conserve biodiversity, and a smart spatial design is integral to achieving successful conservation. For example, coordinated placement of conservation sites considering spatial biodiversity patterns is crucial in improving the ecological outcomes (53–56)....

March 11, 2023 · Akira Terui

放流に意味はあるのか?

野外で何かしら生物を増やそうとしたとき、もっとも安直な方法は「放流」だろう。人が卵から孵化させ、あるところまで育てて外に放す。「元気に暮らしてね」などの言葉とともに、放流イベントとして子供に放流させるケースも多い。 しかし、本当に放流に意味はあるのか? これまでの研究を見る限り、ほとんどのケースで放流に意味はない。むしろ、ほぼ確実に弊害がある。 放流の規模 そもそも放流はどの程度の規模で行われているのだろうか?放流にも様々なものがあるが、ここでは「野生集団の増加を目的として、人の手によって(在来の)生物を野外に放す行為」とし、特に天然資源として価値が高い生物を対象としたものに絞る。 天然資源を対象とした放流事業は、想像を絶する数を野外に放している。その顕著な例はやはりサケ類だろう(一般に食卓にならぶサケは「シロサケ」)。Kitada 2020にまとめられている統計を見ると、その放流数は1980年代にピークを迎え、日本全国で15 – 20億尾/年ものシロサケ稚魚が放流されている。地域ごとにみると、西北海道だけで4億尾強/年のシロサケが放流されている。アラスカのPrince William Soundにおけるカラフトマスの放流事業が6億尾強/年なので(Amoroso et al. 2017)、まさに世界最大規模といって相違ない。ほかの日本のサケ類(カラフトマス、サクラマス)をみても、日本全国で1000万尾–1.5億尾が放されており、とんでもない数であることがわかる。もちろん、これらの生産コストはタダではない。シロサケの場合、1尾あたり2.5円ほどなので、種苗生産そのもののコストだけで年間数40-50億の税金がつぎ込まれていることになる1。 こうした大規模放流は水産資源に限ったものではない。スペインのある地域では、Game birdとして価値の高いRed-legged partridgeという鳥が200万羽/年の規模で放されている(Negro et al 2001)。送粉者として重要なマルハナバチの仲間も、\(>10000\) コロニー/年が導入されている地域もある(Ings et al. 2005)。 放流の効果 これだけ放しているんだから、もちろん増えているんだろう、と多くの人は思うかもしれない。しかし、実際はそうではない。放流効果を検証した研究は必ずしも多いわけではないが2、知見の蓄積している魚類をみると、実は増えないケースがほとんどである。それどころか、減る場合も多い。Araki and Schmid 2010では、水産生物の野生集団に対する放流の効果を調べた41の研究をまとめている(メタ解析3)。このうち、野生集団の明瞭な増加をもたらしたケースはたったの3例にとどまっている(Chan et al. 2003, Berejikian et al. 2009, Agnalt 2008)。なぜか。 生態系は無限に個体を受け入れられるわけではない。 どんな生態系にも「収容力」がある。この収容力を超えた数を放したところで、食べ物の枯渇、生活場の不足などの理由(種内の資源をめぐる競争)から、個体の死亡率は高まる。結果、野外集団の一部を放流個体で「置き換える」だけになってしまい、集団としては増えない(あるいは採算に合わない微増)4。実際に、放流個体による野生個体の置き換えは、魚類で観察されている。国内の事例はSahashi et al. 2015[サクラマス]やKitada et al. 2019[マダイ]、海外ではAmoroso et al. 2017やHilborn and Eggers 2000などが詳しい。ただし、ここで「増えない」といっているのは放流直後の放流+野生集団の話であり、次世代への繁殖を通じた効果を見ているわけではない。繁殖を通じた効果の場合は、余計ひどくなる。極端な種内競争が起こるため、繁殖まで生き残る個体が少なくなり、結果として次世代の集団縮小が起こる(Satake & Araki 2012)5。これは一般的な数理モデルによる予測だが、その後の研究で、サクラマスでは放流数の増加とともに長期的な集団サイズ(21年の平均密度)が小さくなる傾向が観察されている(Terui et al. in review)。 寄生虫や病気の蔓延に寄与する。 私の知るもっとも有名な例は、カナダのBritish Columbia近海におけるカラフトマスの例である。この例では、カラフトマスにとって極めて厄介な寄生者(sea lice)が養殖池で爆増し、放流個体から野生個体への大規模感染が起こった。その結果、この地域の野生集団のいくつかが絶滅に瀕した(Krkosek et al. 2007)。この研究では、その地域の養殖池に由来する寄生者の蔓延が問題だが、他地域から放流個体を持ち込む場合にも同様のことが起きうる。例えば、アユの冷水病がすぐに思いつく。琵琶湖水系由来のアユは全国に流通、放流されているが、これにともない冷水病が全国に拡散したと考えられている(Wikipedia)。ただ、この言説については学術文献に基づく一次情報を見つけられなかったので、あくまで可能性のひとつとしてみておくべきだろう。 放流個体は野外での生き残りが悪い。...

December 29, 2022 · Akira Terui

いつか誰かが見つけてくれる

「いい研究をしていれば、いつか誰かが見つけて評価してくれる」 これは正しくもあり、間違いでもある。ひと昔前と異なり、今のアカデミアは電子ジャーナルであふれかえり、無数の論文の波に否応なしに飲みこまれる。その中から真に面白い論文を見つけることは困難で、やはり「ジャーナル」の評判をベースに読むべき論文の優先順位をつけてしまう(この意味においてインパクトファクターは大事である)。こうした中、自分の仕事をより広く知ってもらうためには適切なプロモーションが必要になる。 私はアメリカに来て5年経つが、その中で一番驚いたといっても過言でないのが「グループ内引用」の多さだ。周りをみていると、次のような戦略で自分のニッチを構築し、プロモーションしているように思える。 まず、グループの旗振り役(PI)が大型予算をとり、そのたたき台として意見論文を書く。多くの場合、この段階では必ずしもアイデアを裏打ちするデータがあるわけではなく、既存の知見からうまくロジックを組み立て、意見論文をまとめているように感じる。ちなみに、こうした意見論文はプロポーザルの使いまわしであることが多い。ずるい。 グループ内から意見論文に沿った論文が次々と生まれ、最初の意見論文、先に出た論文をどんどん引用する。なんだか確立されたコンセプトのようになっていく。実のところ、この段階ではグループ内で固めているだけ。 グループ外の人間が面白いと思い、そのコンセプトに沿った論文を書く。ここで初めてそのコンセプトに市民権が付与される。 この文化を見ていると、アメリカで真に新しいアイデアを生み出している人はごくごく一部で、周りがそのアイデアに乗っかる形で潮の流れが出来ている。あくまで私見だが、日本の生態学会のほうがユニークなアイデアを見ることが多い。にも関わらず、それが大きな潮の流れを作ることはとても少ない。なぜなら、日本の研究文化はステップ1の部分が圧倒的に弱く、ステップ3で他のグループのアイデアに加担(というと言葉が悪いが)しているケースがほとんどだからだ。また、日本をフィールドとしたより関連した論文よりも、欧米の有名論文を引用しているのをよく見かける。 一方、この流れに大きなくさびを入れつつある国がある。「中国」だ。中国が科学の各分野で世界を席巻しつつあるのは周知の事実だが、これはただの数の力や偶然ではないと思う。確かな戦略がある。 2018年のアメリカ生態学会(ESA;Ecological Society of America)に参加したときのこと。ESAはいわゆるマンモス学会で、年会の参加者数は3000人を上回る。規模が大きく、研究対象も多岐にわたるので、会期中にはグループごとにMixer(懇親会)があるのが通常だ。私はAsianグループに興味があり参加してみたのだが、この時の光景がすさまじいものだった。50-70人の参加者がいるなかで、日本人は私を含めて二人1、韓国人が一人、その他はすべて中国人であった。また、その多くはアメリカで学位を取得しようとしている人、Faculty positionを得てアメリカに拠点を築いている人、中国からアメリカで活躍している中国人を「ヘッドハンティング」しようとスカウトに来ている人であった。簡単に自己紹介する中で、スカウト目的で中国から参加している人が、「我々中国はアメリカで活躍する君たちをいつでも好待遇で受け入れる準備ができている!2」とも言っていた。つまり、アメリカに人材を送り込むだけでなく、欧米につながりをもった研究者を積極的に引き込むことで、自国の活性化につなげようとしているだろう(直接聞いたわけではないので定かではないが、ほぼ間違いない)。また、研究の仕方も「チーム戦」がうまい。彼らの研究を見ていると、とにかく自国のいい研究を積極的に引用する姿勢がすごい3。最初は欧米の真似事だったかもしれないが、そこには自身の立派な哲学ができており、今では中国の戦略として確立したものになっているように感じる。 昨今、生態学の主要ジャーナルでは中国発の論文を見ない日はなくなったが、これは数の力だけで説明がつくものではない。確固たる戦略が実を結んだ結果とみたほうがいいだろう。似たようなことが他の分野でも起きているのだろうか? 日本の話に戻る。私が日本の国としての戦略にあれこれ口を出すつもりもないし、どうすればいいのかも皆目見当つかない。中国と同じことをしようとしたところで、現在の日本の大学や研究機関にそんな体力(財源)は残されていないと感じる。それを十二分に分かったうえで、ただひとつ苦言を呈するとすれば、「いい研究をしていれば、いつか誰かが見つけてくれる」が成り立つのはマジョリティーに属している場合のみ、という事実をあまりに多くの人が認知していないことだ。欧米、そして中国が研究のマジョリティーとなりつつある中で、極東の研究者の「いい研究」が知れ渡る機会は想像以上に限られている。個人でできることとすれば、とにかく海外大学も含めてセミナーで飛び回り、積極的に自分の仕事を売ることだろう。それが日本の研究者コミュニティにとってどれほど意味があるのかわからないが、国として学術がすさんだ状況を見る限り、(若手は)個人としてあがく以外に方法はない。 日本の平均的な研究力・創造力はアメリカと比べてそん色がないどころか、大きく上回っているとすら感じる。しかし現状では、多くの欧米人はそんなことは知る由もなく定年を迎えるのだろう。それをなんとももどかしく感じる。 もう少しいたかもしれない。けど確実に5人未満だった。↩︎ まるでマンガのセリフである。もちろん意訳。↩︎ これを真似て、私はできるだけ日本のいい研究を引用するようにしています。↩︎

November 13, 2022 · Akira Terui

Comment on Carraro & Altermatt 2022

6/16/24 the content of this post is officially out in Population Ecology. I never thought I would do this in my life; this is certainly not something I want to do. Yet, there is no option but to write this post because otherwise, the recent paper by Carraro and Altermatt (2022) invalidates my past research (and any research in scale invariance) and future work for unfair reasons. I posted full mathematical details as a preprint here (including the re-analysis of their data)....

November 6, 2022 · Akira Terui

Extract your publication list from google scholar in R

Publication list Coauthor list I have been spending hours to list my pubs for my CV or co-authors for a grant proposal. But now, we can automate this process with R package scholar (see R documentation for general guidance). With some stringr and dplyr functions, it’s pretty easy to export a table of pubs/coauthors via Rmarkdown (if you are unfamiliar with Rmarkdown, see Rmarkdown cookbook). A procedure would be:...

September 2, 2022 · Akira Terui

出版できる図表をggplotで

応答変数(Y軸)の異なる図を並べる 軸のスケールをパネルごとに変える 変数変換 特殊文字 軸名 軸の値 パネルストライプ 見栄えのいい図表を作ることはとても好きで、不必要なほどにこだわってしまうこともある。しかし、「査読コメントに対応するために、図表を作り直すこと」は大嫌いであった*。これには理由がある。学生のころはRの図表作成能力が低かったため、Rで図表のベースをつくったら、細かい調整をパワポやイラストレーターでしていたのだ。この作業は馬鹿にならない時間がかかるのだが、ちょっとした解析の修正や、リバイスの度にやり直しになる。 この作業による時間のロスが無駄だと感じたため、そのまま出版できる図表をコードを走らせるだけで作れるようせっせと豆知識をためてきた。最近ではRmarkdownと合わせれば、MicrosoftのOfficeに頼らずともすべての作業がRで完結する。ここでは、ggplot関連で案外わかるまで時間のかかったものに焦点をあててまとめる。もっといい書き方もあるかもしれないので、そのときはこっそり教えてほしい。今回は種数と面積の関係を模した以下のダミーデータを使って例を示す。 # dummy data x <- runif(100, 0.1, 1000) # hypothetical area m <- model.matrix(~log(x)) # model matrix y <- rpois(length(x), exp(m %*% c(log(5), 0.5))) # hypothetical richness df0 <- tibble(area = x, gamma = y, group = rep(letters[1:4], each = 25)) %>% mutate(alpha = rbeta(length(y), 5, 5) * gamma, beta = gamma / alpha) %>% pivot_longer(cols = c(alpha, beta, gamma), names_to = "metric", values_to = "diversity") print(df0) ## # A tibble: 300 × 4 ## area group metric diversity ## <dbl> <chr> <chr> <dbl> ## 1 526....

May 15, 2022 · Akira Terui

Rの使えるパッケージ/ショートカット

Package tidyverse patchwork sf/raster/stars/exactextractr whitebox Shortcut Code block label (Ctrl + Shift + R) Multi-line (un)comment (Ctrl + Shift + C) Pipe (Ctrl + Shift + M) Package tidyverse データ整理や図表作成に有用なさまざまなパッケージをまとめたもの。もはやこのパッケージなしにはRを使えない。とくにdplyr およびggplot2 に含まれる関数群にはお世話になりっぱなしである。このあたりの関数の使い方はWeb上にあふれているので割愛。dplyrであればHeavyWatalさんのWebsiteが分かりやすい。ggplot2に関してはFrom data to Vizがビジュアルから入れるのでとっつきやすい。 patchwork ggplot2とセットで使うとことを想定したパッケージ(patchwork)。データフレームをグループごとにプロットする場合、facet_wrapやfacet_gridなどの関数を使うことが多いと思う。これらは非常に有用な関数なのだが、すべてのパネルで同じ構造(xとyが一緒など)をとる必要がある。しかし、論文の図を作る時、フォーマットの異なる図を横に並べて一つの図としてまとめたいことも多いと思う(例えば散布図と箱ひげ図を並べる、など)。そんなときに役立つのがpatchworkである。このパッケージを使うと、複数のggplotオブジェクトを好きなように配置できる。irisを使って例を下に示す。 pacman::p_load(tidyverse, patchwork) # scatter plot g1 <- iris %>% ggplot(aes(x = Sepal.Width, y = Sepal.Length, color = Species)) + geom_point(alpha = 0.3) + theme_bw() # box plot g2 <- iris %>% ggplot(aes(x = Species, y = Sepal....

April 9, 2022 · Akira Terui