Tellus Satellite Boot Camp【東京】(衛星データ活用技術者養成講座)

さくらインターネット主催する、Tellus Satellite Boot Camp【東京】が2月9日~2月10日に開催されました。
宇宙ビジネスの中でも、いま一番実用化が進んでいる分野が、衛星データを活用した宇宙データビジネスです。すでにたくさんの分野で事例が出てきてはいますが、一部の限られたものにすぎないのが現状です。それは、一般の人が衛星データを活用するために、使いやすいソフトウェア・処理設備の環境が整備されてないことと、専門的な技術が必要なことが原因です。

経済産業省は「平成30年度政府衛星データのオープン&フリー化及びデータ利用環境整備事業」をすすめています。この事業は、さくらインターネットが2018年5月9日に委託先としての契約を締結しました。そして、さくらインターネットは事業の目的に合わせた、政府衛星データを誰でもすぐに無料で利用できるようにするためのプラットフォーム「Tellus」を開発しました。

「Tellus Satellite Boot Camp」では、「Tellus」をベースに宇宙データビジネスを一般の企業に広めていくための第一弾として、衛星データの基礎知識から深層学習までを習得できる機会を提供しています。内容としては、概論と演習に分かれていますので、今回は1日目の前半に行われた概論を中心にご紹介します。

<開催概要>
タイトル:Tellus Satellite Boot Camp
主催:経済産業省
運営:さくらインターネット株式会社、株式会社SIGNATE、一般財団法人リモート・センシング技術センター(RESTEC)
会場:東京、大阪、札幌、福岡、山口

<当日タイムスケジュール>
【1日目】
10:00~10:30 トレーニング目的、Tellus紹介
10:30~11:00 リモートセンシング概論
11:00~11:15 休憩
11:15~12:15 データサイエンス/AI概論
12:15~13:15 お昼休み
13:15~13:45 衛星データの機械学習用データ整備について
13:45~14:45 衛星データ解析ツール演習 
14:45~15:00 休憩
15:00~16:30 衛星データの機械学習用データ整備演習
16:30~17:30 Tellus相談会

【2日目】
10:00~13:00 Pythonによる実データ解析演習
13:00~14:00 お昼休み
14:00~17:00 衛星データを対象とした深層学習演習

トレーニングの目的 Tellusの紹介

「Tellus」は、さくらインターネットが経済産業省から受託した宇宙ビジネス事業の一環です。
経産省は、宇宙ビジネス規模を現在の1,2兆円から2030年までに倍増させることを目的としています。
そのために、衛星データを利用する環境を整えて、一般の人や企業が自由に使えるようにすることを目的にしています。
これを実現するためのツールがTellusで、簡単に言うと衛星データのプラットホームです。
日本の衛星データや地上データを、コンピューターを活用して、いろんな人に使ってもらうためにある企画と言えます。民間企業をはじめ、研究機関、大学、個人まで、誰でも手軽に、自由に利用できることを目指しています。

■Tellus展開で大切なことと6つの仕掛け

さくらインターネットはTellusを広めていくために3つのことを意識して作成しています。
・「できる」ことではなく「前提である」こと
・失敗が許されるスピード、コストでチャレンジできること
・異なる組合せ、イノベーションが生まれること

そして、これらを基盤に6つの仕掛けをTellusに組み込んでいます。
・Cloud(宇宙データを活用するためのストレージと、書くサービスを利活用するためのコンピューティングを提供)
・宇宙データの提供(オープン&フリー)
・ライブラリ(データを利活用するためのドキュメントの提供。宇宙データビジネスのニュース、事例の紹介)
・データコンテスト(宇宙データを活用したコンテストを開催)
・ストア(宇宙データを扱うツールを有料、無料で提供)
・ラーニングイベント(宇宙データ活用のためのイベントが定期的に開催)

また、Tellusは「衛星データプラットフォーム」であることだけでなく下記のような新しい存在を目指しています。
・高性能データ(高額・SAR衛星データ)の公開
・コンピューティング環境の提供
・商用利用が可能

今後のスケジュールとしては、Tellus開発と利用の促進を目的としたを「xDATA Alliance」を結成して利用の促進を進めていく予定です。
「xDATA Alliance」は宇宙産業関連の事業者・研究機関・団体が集まっています。
日本各地でのセミナーやコンテスト、WEBでの情報提供をメインに活動しています。

リモートセンシング概論

リモートセンシングとはどんなものなのか、今後どういった発展をしていくかを、リモートセンシング技術センターの担当者が説明しました。

■リモートセンシングの種類

リモートセンシングは、簡単に行ってしまうと、人間の目では見えない「センサ」を使って対象をみることがリモートセンシングです。対象までの距離は関係なく、宇宙からでも飛行機からでもドローンからでも、センサを使って対象を見れば、それはリモートセンシングだとしています。

リモートセンシングの種類を理解するために知っておかなければならないこととして、下記3つをあげています。
1:波長(波長ごとに違うものが見えてくる。赤外線や紫外線、電波など波長の長さの違いによって、見え方がかわる)
2:反射(光が反射してはじめて物が見えるため、反射の強さが重要。対象物には反射の強さがあり、それによって色や性質で現れる)

この2つを使い情報を得ることがリモートセンシングです。
また、放射(熱をだしている物体)や、反射特性(EX植物 緑色はたくさん反射するが赤はあまり反射しない)なども、ものの性質をあわらしています。これらをこまかくセンサで見ることで、対象物がなにかを判別することができるとしています。

■光学リモートセンシングの種類

光学リモートセンシングは、太陽から反射された光を、衛星のセンサが観測して対象物の情報を取得します。ものの波長や反射によって、見え方が変わってくるため、細かく分けていくと多くの種類があります。

・波長帯域の違い(可視・反射赤外、熱赤外、マイクロ派)
光学(雲など光を通さない物も映る。地形の凹凸などは光の反射によって見えないことがある)
マイクロ派:電波(天気や昼夜に左右されない。地形のちがいがはっきりわかる。色味はない。)

・バンドの違い(光学センサの波長帯域)
光学センサは、波長や反射特性によって見え方の違いが出てきます(波長が短いと紫、長くなるにつれて見える色が違ってくるなど)
リモートセンシングのセンサーには、バンドという名称で波長帯域がいくつかに分けられています。
バンドは1~6まで振り分けられています。(例、バンド1 0.45-0.52μm 青色~緑色。バンド2 0.52-0.60μm 緑色~黄色)

■電波(マイクロ波)による観測の詳細

衛星から電波をだして地上にあて、返ってきた電波をセンサが観測して対象物の情報を取得します。
対象物にあたり跳ね返ってくる電波と、跳ね返ってくるまでの時間を図ることで、どこに何があるのかを知ることができるとしています。
電波の波長にもバンド名称があり、それぞれに特性があります。

Xバンド 波長3㎝くらい
Cバンド 波長5㎝くらい
lバンド 波長20㎝くらい

電波はものの形を見ているので、形の大きさが重要で、上記のような波長の大きさに見合ったものが見えてきます。また、ものの表面粗度(表面の凸凹など)によっても、見え方の違いがでてきます。
(例えば、xバンドであれば、木の葉っぱも見えますが、lバンドの電波は、3㎝の葉っぱは通りこして、地面が直接見えてしまう。)

■リモートセンシングのポイント

上記のように、リモートセンシングは光や電波を利用して、ものの情報を得る方法です。
しかし、ものの特性によって、適切なやり方が変わってきてしまうため、自分が何を見たいのかを把握したうえで、センサを選ぶことが大切だとしています。

データサイエンス/AI概論

最近話題に上がることの多いAIですが、AIはどういったものなのか、活用していくポイントは何かということが分かるパートです。

・講師 高田朋貴氏 SIGNATE Inc. DatesscienceTeam
・概要 レクチャー1 AIとは/レクチャー2 AIを支える3要素

■レクチャー1 AIとは

様々な分野で広く活用され始めている「AI」ですが、実は明確な定義はまだないそうです。
研究者によって、定義が大きく異なりますが、高田氏は下記のように定義していました。
「人間の知的行為を計算機で模倣させたソフトウェア」

■AIは本当に必要か

日本においては「労働人口の減少」という理由から限りなく重要になってくると予測されるとしています。
労働人口の減少からは、下記のような問題が生まれてきます。

・人が足りない(マンパワー不足)
・リタイアにより、ノウハウが消失している(情報ノウハウを蓄積するための手段)
・効率性(人が少ない中で同じ業務をどうやっていくか)

これらの解決策の一つとして、人工知能に期待が集まっています。

■AIの歴史

AIには、過去3回のブームがあり、現在は3回目のAIブームとされます。
・第一次AIブーム 推論と探索(おもにゲームで使われる チェス if then ルール)
フレーム問題(枠の中では動くけど、それからはずれるとだめ)にぶつかりブームは下火に。

・第二次AIブーム 知識工学(ナレッジベースが研究されたのがこの時期)
新しい知識を蓄えるために管理コスト、工数が問題となり下火に。

・第三AIブーム 現在。
ハードウェア、ビックデータ、最新技術の機械学習が発展してきた。

■AIの種類 仕組み

一言でAIと言っても、大きくは下記2つのタイプがあります。
1:特化型人工知能
人間の知的行為のみに特化して動作するAIです。
最近言われているAIは99%がこのAIとのことです。
2:汎用型人工知能
人間と同じで、新たな知識を自ら学習していくAIです。
分かりやすく言うと、ドラえもんやアトムのようなイメージです。
もちろんまだ研究途中の段階です。

■AIの機械学習

AIは、基本的には「大量のデータ」をもとに、規則性やルールを学ぶため、学習対象となるデータの質と量が大事だとしています。
こうした、データからパターンを発見したり、利用することを「機械学習(Machine learning)」と言います。
機械学習の得意なこととして、下記2点があげられます。
1:未知の情報を予測すること
2:仲間分け

■機械学習と深層学習

第三次AIブームで技術の進化で使えるようになってきたもので、深層学習(Deep learning)があります。
人間の脳神経系のニューロンのように、ネットワークの層が幾重にも重なる構造を持つ機構を用いた学習のことだと言われています。
昔は2~3層だったのが、現在は技術の進化と結びつき多いもので1,000層を超えるものもあります。
画像や動画データに対して高い精度を誇り人間よりもすぐれた精度がだせている分野もあるそうです。

深層学習によって、身近な例では、下記のような事例があります。
・AlphaGo(囲碁AI。囲碁はルールが複雑なため、人間に勝つには20年くらいかかるといわれていたが、深層学習の発展で2~3年でできてしまった)
・Google翻訳(2016年に深層学習を利用したことで、で飛躍的に精度が向上)

また、ビジネス領域でのAI活用として下記をあげています。
1:回帰:数量予測(商品の需要予測・廃棄ロスなどの問題)
2:分類(ネット広告クリック予測、カード不正使用検知など)
3:テキスト(自動校閲・誤字脱字の検出、メディカルコーディングなど)
4:画像・動画(物体の領域検出、リアルタイム道路認識など)

■Lecture1のまとめ

AIには機械学習が使われており、深層学習が主流になってきています。
しかし、こうした機械学習は、機械が学習しやすいように前処理をすることが必要となります。
そのため、データの処理などができるAI人材が不足しており、今後も重要性を増していくとしています。

■レクチャー2 AIを支える3要素

今後、AIを活用していくにあたり必要な条件を3つあげています。

1:計算資源
データを処理するために専門的なツールが必要です。
試行錯誤が必要なので、回数が大事。一回に何十時間もかかっていたら効率が悪いです。
この問題を解決するのが、AIクラウドサービスです。
主に、GoogleやAmazon、Microsoftなどのサービスがあります。

2:データサイエンティスト
データ分析をもとに、現状分析から開発までを行う専門家のことを言います。
実務上は、ヒアリングなどから課題を設定し、AI開発、運用まですべて行うため、3つの要素が必要としています。
・ビジネス力(ヒアリングなどで状況を理解し、課題の整理解決する力)
・データサイエンス力(情報処理、人工知能、統計学など知識を理解して活用する力)
・データエンジニアリング力(使えるように実装、運用していける力。Pythonなど専門的なツールを扱うスキル。)

現実は、3つ得意な人はほとんどいなくて、それぞれ得意な人がチームを組んでやっています。

3:データ
データを用意する方法としては下記の3つがあります。
・自社データ
・公開データ
・独自で作成

上記のどの方法でも、作りたいもの、解きたいタスクによって、必要なデータは変わってきます。
そのため、データからAIをつくるのではなく、どういったAIを作りたいかをはじめに考え、そこから必要なデータが何かを考えていく必要があります。

全体のまとめ

人口が減少していく日本において、衛星データやAIが世の中に役立つサービスを生み出す可能性は大きいと思います。
しかし、まだ専門性が高く一般の企業などで扱える人材も少ないのが現状です。少しでも多くの方が衛星データの可能性と活用法を知ることで、宇宙ビジネス関連の新しいサービスや使い方が生まれていくスピードが加速していきます。今後のTellusの普及や発展に、より一層の期待が集まりそうです。