刹那のチャレンジ

 先日 NHKのある番組で ”チャレンジ”しなきゃはじまらない みたいな意見で終わる番組があった。

  ”チャレンジ”という行動を定義せずに、”チャレンジ”を語っているように思えたので、感じたことをまとめてみた。

  ”チャレンジする”という言葉が使われるとき、”なんらかの目標に向かった、プロジェクトを起こし実行する”という”長い期間”の”活動”を指すことが多い。(個人的なものもあるが、他者を巻き込んでいく活動も含まれる)
  しかしながら、”刹那のチャレンジ”を日々の現実世界では要求されているように思う。

  •  ”恋心をいただいてしまった他者に、愛を告白する”という目的。

それを行動に移すとき、たとえば、具体的な言葉”今度の日曜日に映画いきませんか”と発語する(または、手紙を書いてポストに入れる)行動を起こす前の試行錯誤する”チャレンジ感”は、ものすごくインパクトがあり感情が揺れる。それを超えなければ目的は絶対に達成できないチャレンジであって、おそらく、”チャレンジ”という言葉にピッタリな感情と思考の動きではないかと思う。

  • 大きなチャレンジプロジェクトは、”刹那のチャレンジ”を積み重ね

  なので、この”刹那のチャンレジ”に注目して、いろいろな研究なり、議論なりが行われるべきではないか? と考えている。

  • ”刹那のチャレンジ”が重要

 また、”刹那のチャレンジ”が重要であると考えるならば、”チャレンジ精神が重要”という言葉を言い換えると”刹那のチャレンジが重要”おちうことであり、”刹那のチャレンジ”を行った人は結果がどうであれ評価されるべき ということにしたほうが良くないだろうか。
  つまり、”刹那のチャレンジ”は、だれでもできることであって、身の回りで行動をしなければならない多くの場面で、”刹那のチャレンジ”を実行しなければならないときがあって、そのときに全集中して”刹那のチャレンジ”を成功させるように、考え行動することが大事ではないか と思う。
 大きなプロジェクトを行うことがチャレンジということにしてしまうと、道半ばであきらめると”チャレンジしなかった”ということになるが、そうではないのではないか。

  •  逆に、”チャレンジしない”とはどういうことかを考えてみるとよくわかる。

たとえば、留学したい という目標を持ったとしよう。
この目標を持つ ということ自体が刹那のチャレンジ”と考えて良いのではないかと思う。なんとなく”留学”と思っている状態から、”留学考えてみるか”に変わるときに、個人差はあるにしても”勇気”がいる。次に、方法を検討しなければならないだが、グーグルで検索してみるといろいろな情報があるが、相談できるとろが見つかったとして、”相談する”というチャレンジを行わなければならない。そこで、”相談するの面倒だから、留学するのやめる”という行動をとったとすると(具体的には電話をかけないという行動かな)、これが、”チャレンジしない”ということになる。”刹那のチャレンジ”をやめた時点で、目標をあきらめたことになる。これが”チャレンジしなかった”ということではないだろうか。
 しかしながら、”留学したい”と思い、グーグル検索まではチャンレジしていることは、評価されるべきだと考える。

  たとえば、”パイロットになりたい”と思ったとしよう。
なんらかのパイロット養成のコースに入学しなければならない。その試験に合格するために勉強を行う必要がある。勉強するためには、時間をやりくりしたり、誘惑と戦ったりしなければならない。具体的には、友達から遊びのお誘いがあっても断る というのが”刹那のチャレンジ”であったりする。そして、試験に合格して、コースに入ったとしよう。しかしながら、訓練を行っているうちに、視力の低下が著しくパイロットの資格の条件を満たすことができなかったとすると、パイロットになれない。ここで、かれは残念ながらチャレンジできなくなってしまう。しかし、これは”チャレンジしない”ということではない。

  • 結論

 このように”刹那のチャレンジ”に分解して考えないと、途中であきらめたひとは”チャレンジしなかったひと”ということになってしまう という問題から逃れられない。
 また、実現できそうにないことを目標とするとに、それを実現するための具体的行動は、個々の小さな課題(電話をとりあえずかけてみるみたいな)にチャレンジすることである という精神的メソッドを具体的に明確に示すことができるのではと考える。

 

コロナ禍で学んだこと

たくさん書いたけど、単なる書き溜めたつぶやきなので、見逃してください。
・不要不急の物や活動で経済が成り立っていること。つまり、人にとって、不要不急の物や活動は、生きていく上で必須だったこと。さらに、仕事をすることは生きていく上で大事なことだが、仕事をすることそのものが大事なのではなく、仕事をした結果として得られる不要不急の物や時間や状態が大事なのだと確信したこと(仕事が終わった後に飲む冷たいビールの一口目のために仕事をする みたいな)。コロナ禍での”不要不急”とは、”生存するためには不要なこと”という意味。ということは、人は、”生存するためには不要なこと”のために一生懸命働く動物であるということ。
・一方、人が生存するのに必要なことが、ハイライトされていなかったこと(医療用具の海外依存、感染対策のインフラの脆弱さ、保健所の役割の認識不足、行政のデジタル化の遅さと品質の悪さ、教育のデジタル化の遅れ、リモートワークではうまくいかないという間違った認識等々)。それらは、軍事防衛政策と同等であることが認識されていなかったこと。
・社会的距離(物理的距離)を取ると、混雑しないので、できれば、常時、混雑しないようにはできないか と思ったこと。つまり、売上の面積単価をあげると儲かるのであるが、混雑することで人は不快になるわけで、”混雑しない”で、まあまあ生きていければいいんじゃないか という考え方にはなかなかなれないのかなぁ と思ったこと。
・自由とは、コンセンサスの上に成り立つもので、コンセンサスが得られれば、個人の自由を束縛するような措置も不快ではないこと。また、個々人勝手に行動すること=コンセンサスを得ていない行動は、”不自由”に向かうということ。つまり、社会的生き物であるヒトの”自由”の定義がほんの少し見えたこと。
・お金をたくさん社会に出しても、インフレにはならず、景気は悪くても、人々の生活がまぁまぁ維持されているように見えること。加えて、お金持ちの方々は、不安の中、余ったお金を、株や金に変えるのでそれぞれ相場があがること。貧乏人はお金を使い、お金持ちはお金を使わない。ということは、経済をさせているのは実は貧乏人 ということなんだな。
・人類は、協力する(コンセンサスオリエンテッド)ことで勢力を広げてきたにも関わらず、コンセンサスを得る面倒さから逃れるために、いろいろな社会システムや技術を開発して、”ひとりでも生きていける”ように不要不急の物やサービスを生み出してきたのでは。つまり、”豊かなくらし”とは、”ひとりで生きていくくらし”ということで、そらぁ孤独になるわな。でも、ヒトは孤独を好まない。
・無観客の野球中継を見ていて、草野球に見入っているときのことを思い出し、プロ野球を見るのが面白いというよりも、野球を見るということが面白いのだということに気づいたこと。つまり、野球に限らず、他人がスポーツやゲームをやっているのを見るのが好き というヒトの特長があって、その上にプロスポーツがなり立っているということ。草野球を中継しても、見入ってしまうのでは。

ブログ再開します。

テーマは、「Long read・ロングリード」。

ロングリードのパフォーマンス

ロングリードの技術は

PacBio RSII

 最近の実績は、1CELLで800Mbp以上は普通に読めます。1Gbp前後読めている場合がほとんどです。バクテリアのゲノム長が4Mbpとすると、200倍読めていることになるので、アセンブルして得られるContigは、一本に繋がり、コンセンサス配列の品質もかなり良いようです。

PacBio Sequal

 1CELLで3Gから4Gbp読めてしまいます。品質はRSIIと同じです。1CELLの量が約4倍になって、RSIIを4CELLRUNさせるよりコストが下がりました。

Oxford Nanopore MinON

 1CELLで10Gbp以上読めるとのことですが、まだ、コメントできるほどの実績がありません。 ただ、非常に良くないリードでも、放線菌ゲノムが一本になるということは経験しています。

Chromium

 ライブラリ作製時に、同じDNAから調整したことを示すバーコード配列を付与して、Illumina HiSeq X (ショートリード)でシーケンシングし、アセンブル時に仮想的にロングリードにする方法。こちらもコメントできるほどの実績はありません。ただ、ショートリードだけでアセンブルするのと比べて、かなりコンティグ配列の数が少なくなることは確かです。

ロングリードのメリット

 ロングリードのメリットは、ゲノムの一次構造が明確になることです。もちろん、数キロ以上のリピートがあれば、それを捉えることは難しいかもしれませんが。
 一次構造が明確になると、ショートリードでは見えなかった、大きな領域の転座や逆位が見えてきます。そして、近縁株間で大きなゲノム構造の起こった領域の境界にある遺伝子が影響を受けていることがわかります。これは、ショートリードでは見えない場合がほとんどです。
 また、同じ遺伝子が複数個所にあることもわかります。それらの遺伝子がすべて完全に配列が一致しているわけではないこともわかります。しかし、ショートリードではこれを見極めるのは難しいと思います。

ロングリードの課題

 バクテリアは、ほぼ一本につながります。しかしながら、ゲノム配列の中には入れなかったコンティグ配列が複数現れることがあります。それは、なぜなのか、検討する必要があります。
 酵母は、1セットの染色体になりません。なぜ、1染色体1本にならないのか、その理由をさぐる必要があると考えています。
 そして一番の課題は、倍数体がどのように見えることになるのか?
 データ解析を行うわたしどもも、これらの課題に取り組んで行っていこうと考えております。

プロテオームの領域での役割を考えてみました。

 明日から、日本プロテオーム学会に出展します。会期は、2014年6月17日から2日間、つくばの国際会議場で行われます、
 https://unit.aist.go.jp/gtrc/jhupo2014/index.html
 6年ぶりの出展になります。展示のメインの商品は、KMデータ株式会社様のKeyMolnetです。
 もうひとつの目的は、プロテオームの領域での市場調査です。質量分析機器の精度があがり、また、種々課題を乗り越える努力をされた結果、定量的発現解析が可能になってきたことをいろいろな先生からお聞きしていました。その状況で、核酸配列やヴァリアント情報を扱う我々がお役に立つことができるのかを学会に展示することで調査してみたいと考えております。

過去の製品は今もニーズがあるのか?

 以前、質量分析での同定精度をあげるための商品を2点開発して販売していましたが、売れ行きがいまいちなので、営業を止めていました。しかしながら、我々の商品に興味を持っていただいて、ときどき問い合わせをいただくこともあります。これらは、今、プロテオームを行っておられる研究者の方に、どのように捉えられるのでしょう。もうすでに、だれかがなんらかの方法で対応しているのでしょうか?楽しみです。

Sequece Composer バリアントアミノ酸配列作成プログラム

UniProtに格納されているバリアント情報をもとに、各遺伝子ごとのアイソフォーム作成や1アミノ酸置換、シグナルペプチドの除去などの加工を行ったアミノ酸配列を生成します。また、アミノ酸配列ビューアを搭載していて、変異位置を提示することはもちろん、修飾情報も提示します。
http://www.maze.co.jp/bio/proteome/143.html

Human-PERFECT/Mammalian-PERFECT 未知蛋白質を同定するためのEST配列を含む転写配列セット

 NCBI-nrから、ヒト・マウス・ラットのアミノ酸配列だけを抜き出した配列群、EST配列をアセンブルして得られたコンセンサス配列群、さらに、コンセンサス配列をゲノム配列のアライメントしてゲノム配列を切り出してEST配列の精度をあげたGenome refined consensus配列群で構成されています。
http://www.maze.co.jp/bio/proteome/132.html

KeyMolnetはプロテオームの分野でどのように販売すれば良いのか?

 KeyMolnetという商品は、ヒトが日々論文を読み、論文に記述されている”確かな”2つの蛋白質の関係、及び、それぞれの蛋白質の関連情報(疾患、病態、パスウエイ、シグナル伝達経路等)を蓄積しているデータベースであり、それを参照するソフトウエアです。我々は、約2年間、この商品の販売を手掛けておりますが、核酸を扱う研究者の方へのアプローチでは、手ごたえを感じております。KeyMolnetは、網羅的解析を行って、得られらた候補から意味解釈しながら実証実験にもっていく候補遺伝子を選ぶためのツールです。プロテオームの世界で、網羅的候補探索はどのように行われ、そこで意味の解釈を行いながら候補を絞り込むという場面で、どのようなニーズがあるのかを調査したいと考えています。

お客様はだれなのかを改めて認識したかも

 昨日、MidnightBioTVの再放送を行いました。再放送ですから自分で見て聞くことができました。わたしのプレゼン内容はまだまだ未熟だなと感じ、Keymolnetは、やはり単にデータをコレクションしただけではなく、候補蛋白質を考察するための至宝のツールだと改めて思い、また、コンピュータ技術でバイオテクノロジーに貢献する企業がストリーミング配信する意味というのを改めて考えてみなければと思いました。

どこに向かって仕事をするのか

 わたしどもは、バイオテクノロジーという分野で、コンピュータとソフトウエアを生業にした企業活動を行うにあたり、ツールとサービスを提供して、お客様により良い研究成果を出していただくことが目標となります。また、近い将来おとずれすであろう(すでにその兆しは、ここかしこで実施例が出始めている)次のステップ:生産現場や医療現場へのバイオテクノロジー技術の応用展開のステップでは、ツールをサービスを提供して、お客様により生産性・品質の向上を実現していただいて、さらにその先におられるエンドユーザ様に満足いただける活動の一助になることが目標となります。つまり、我々は、お客様がバイオテクノロジーのすばらしさを享受していただくために活動を行うのだということを再確認できました。

そのためには

 わたしどもは、まず、次世代シーケンサのデータ解析のオペレーションを簡単にできるようにしました。次の課題は、現バージョンのブラシュアップと、データ解析の下流に向かってのシステムの機能の拡充です。ツールに磨きをかけていくには、ツールをたくさん使っていたいだいて、そこから要望をいただくことであり、また、自分でももっと使ってみてより使いやすくなる項目をたくさん見出すことだと考えています。また、下流に向けての機能拡充は、SubioPlatform(株式会社Subio製)やKeyMolnet(株式会社KMデータ製)を我々がもっと使ってみて、上流でのアウトプットに必要な課題をたくさん見出すことだということがわかりました。

プレゼン内容もポリシュアップ

 そういう意味では、プレゼン内容も、実例を用いて解析手順を示しながら、どのような考察にツールを使うとどのような効果があるのかを示すようなものに変えていく必要があり、ストリーミングで流すならKMデータさんが行われているように、公開されている実際のデータを使って、その場で解析して、しかも、インパクトのある結果を提示していくのが良いのではないかと思っています。つまり、たとえば、MidnightBioTVのチャンネルの番組のタイトルとして、今回KMデータさんがプレゼンされた”?型糖尿病をテーマとして、SNP解析とマイクロアレイ解析データを使ったオミックス解析による候補考察”のようなことを掲げたて、複数人でわいわいやりながら、候補探索をしていくような放送ができれば良いなと思っています。

本日、MidNightBioTV久しぶりにOpenします

[次世代シーケンサ]コンピュータの専門家を必要としない データ解析システムとは

 ここ1年半、わたしどもは、”コンピュータの専門家を必要としない データ解析システム”を提供する取組を行ってきました。この取組が少しまとまってきましたので、取り組みの基本となる考え方と、実際に開発したシステムをご紹介し、膨大に産出される生物情報のデータ解析を行われる”コンピュータの専門家ではない方”及び”コンピュータの専門家の方”のお仕事に少しでもお役に立てばと思いまして、今回のMidNightBioTVを企画いたしました。

最大の課題は”コンピュータやソフトウエアが扱える専門家が不足している”こと

 ここ3年程で、次世代シーケンサの普及が急激に進んでいます。そこで発生した最も深刻な課題は、データ解析を担当するコンピュータやソフトウエアの専門家が不足している点です。このことが、研究に次世代シーケンサを活用しようとするモチベーションを下げているのは明らかです。しかしながら、世界中で次世代シーケンサを利用した研究が行われていますので、使わざるを得ないということも事実です。そこで、”バイオインフォマティシャンを養成する”ということが、官民で進められています。人材を育てるということは、たいへん重要な取り組みだと思います。が、しかし、人材が育つには時間がかかります。また、カバーしなければならない領域が多岐に
わたり、シーケンサから産出されるデータの量の増加率は、おそらく、”バイオインフォマティシャンが養成されるスピード”をはるかに超えていることも間違いありません。

ならば、”コンピュータの専門家を必要としない データ解析システム”を提供しよう

 ということで、いろいろ課題を残しながらも、必要とされるシステムを必要とされるところに供給する取組をはじめました。

今回のセミナーの内容

 今回のセミナーでは、次のような内容のお話をする予定です。途中、チャットでもTwiterでも結構ですので、どんどん質問やご意見をいただければと思います。
日時:2014年4月22日(金)20時開始
http://www.ustream.tv/channel/midnight-bio-tv:Ustream MidnightBioTV

1)網羅的解析を行う際のデータ解析の種類と提供するソフトウエアの概要
2)Exome解析のシステムについて
3)mRNA-seqのシステムについて
4)Keymolnetについて(KMデータ:谷口さん)
5)Keymolnetを使った解析のデモ(KMデータ:谷口さん)
6)NGSの現場における今後の課題と解決へに向けて

転写産物の発現と細胞間の相互作用に関する妄想

 シングルセルに関する発現解析が進む中、HiCEPの測定結果を日々見ていると、細胞と組織と発現プロファイルについて妄想が大きくふくらんでおります。そこで、ここに書き留めておくことにしました。
 HiCEP(Hign Coverage Expression Profiling)法は、低発現の転写産物から高発現のものまで、その発現量をほぼ同じ程度の誤差で観察することができる、とてもすぐれた網羅的発現解析手法です。ひらたくいうと、ほぼすべての転写物を”正確に”プロファイリングできる手法です。それについては、本ブログで以前に書きました。”アレイと比べる”話 - 転写産物をクラスタリングして見えてくるもの - 転写配列旅日記そちらを参考にしてください。また、HiCEP法の詳細はこちら http://bit.ly/NjbQTj
 このHiCEP法は、PCRで増幅して、キャピラリーで電気泳動して波形を得、ひとつのピークの蛍光強度が1転写産物の発現量に相当する手法です。しかしながら、PCRを使っているため測定された1転写産物の蛍光強度は、実際の発現量を正しく表したものではありません。しかし、HiCEP法で得ることができるピークの強度が発現量を反映しているという前提で妄想してみました。

低発現転写物の発現転写産物全体に対する割合に関する妄想

 ヒトの末梢血(単核球)にHiCEPを実施すると約3万のピークを得ることができます。ひとつの検体で見ると蛍光強度を持つピーク数(蛍光強度が50以上)は約2万5千、その中で、極低発現の転写物・蛍光強度200以下のピーク数が約1万3千、低発現の転写物・蛍光強度が1000以下のピーク数が約2万、蛍光強度1000以上のピーク数は約5千という結果となりました。

ピーク数 割合
総ピーク数 約3万5千 -
1サンプルのピーク数 約2万5千 100%
蛍光強度200以下のピーク数 約1万 52%
蛍光強度1000以下のピーク数 約2万 80%
蛍光強度1000以上のピーク数 約5千 20%

つまり、1サンプルに検出されている約2万5千の転写産物の内、80%以上は低発現転写物であり、さらにその中の50%以上は極低発現転写物であると妄想できます。

極低発現転写物とはどの程度低発現なのか?

 HiCEP法の測定法で1細胞中mRNA何コピーまで検出できるかを検討するために、試料にmRNAを濃度を変えながら混入させて、HiCEPを行ったところ、10細胞に1コピーで蛍光強度約1000程度あることがわかりました。もちろん、PCR効率がフラグメントによってかわるので、これを基準に考えることができないのはわかっているのですが、そこをあえて目をつむって妄想するならば、HiCEPは、10細胞に1コピーにとどまらず、100細胞に1コピーしかない転写産物を検出して、さらに、それが2倍3倍と増加していく様子を網羅的にとらえることができているということになります。

極低発現の転写産物が増加するというこは?

 100細胞に1コピーしか存在しないmRNAが2倍に増加するということは、ひとつの細胞の中で、もう一本mRNAが転写されて現れたという解釈もできますが、そのmRNAを1コピー持っている細胞の数が2倍になったも考えられます。つまり、1細胞内の反応でmRNAのコピー数が増えているのではなく、細胞間の相互作用の中で組織として転写産物が増えているという解釈もなりたつのではないかと妄想しています。

組織はまさに組織的?

 となると、一見均一に見える組織細胞群ではあるが、実は、細胞ごとに別々の役割をになったヘテロな細胞集団ではないか? それはまさに、個別の役割を持った多数の社員が組織化されて企業活動を行う会社と同様、個々の別の役割を持った細胞が多数集まって組織化されたものが生体内の”組織”ということになるのではないかと妄想しています。

MidnightBioTV、4月22日(火)20時から行います。テーマは、網羅的解析で得られた測定結果を、バイオインフォマティクスの専門家ないで、本物の候補まで持っていくツールをご紹介します。HiCEP法の網羅的解析における位置づけをお話します。