ビッグデータがスマートシティに果たす役割

2020年09月22日 クラウディア・アブレウ・ロペス 国連大学, カラム・ハンドフォース UNDP Global Centre for Technology, Innovation and Sustainable Development

ビッグデータは国際開発や都市環境の改善との関連で論じられることがよくあるが、いったいどのようなものなのだろうか。どのように利用でき、なぜスマートシティの重要な要素となっているのだろうか。

ビッグデータとは携帯電話やウェブサイト、人工衛星、センサーなどのデジタル技術によって生成されるデータのことである。こうしたデータを効率的に獲得、キュレーション(整理・公開)、管理、分析するためには、データサイエンス、つまり人工知能のツールや手法が必要である。ビッグデータは私たちのデジタル行動の副産物であることが多く、私たちが日常生活でシステムや機械とやりとりする際に残すデジタルの「断片」が基になっている。

ビッグデータは持続可能な開発目標(SDGs)の達成において、個人の貧困を予測するために携帯電話のデータを分析することから、都市部の中での移動におけるジェンダー格差を理解するまで、あらゆる取り組みに利用されている。しかし、スマートシティや、より広範な都市環境の改善の促進にはさらに深く関わっている。

ビッグデータのデータソースは、ヒト由来データ(ソーシャルメディア、ブログ、クラウドソーシングなど)、プロセス媒介データ(金融取引、電子カルテ、納税記録など)、機械生成データ(衛星画像、モノのインターネット(IoT)デバイスのデータなど)、およびメディア由来データ(ラジオ放送、デジタルニュースなど)に分類できる。

こうしたデータソースはとくに都市環境に存在し、それらの活用は都市をより住みやすい場所にするために不可欠な役割を担いうる。たとえば、IoTデバイスによる機械生成データには、移動、交通手段の利用状況、生活状態などが含まれ、自治体職員やその関連組織がよりよい政策を考案するのに役立っている。携帯電話ネットワークのデータも、人々が都市とどのように関わっているかを理解するために利用されている。こうしたデータソースの多くは、組み合わせることによってさらに詳細、タイムリーかつ適切な情報を生み出すことにもなる。

しかし、ビッグデータは万能薬ではない。現実的な限界がいくつもあり、大きな問題をもたらす可能性もある。不完全であるため、複数のデータソースを組み合わせる必要があるということだ。またビッグデータは、私たちのデジタル行動の大部分を支配する民間組織が所有または管理しているため、アクセスできないことも多い。このことから、偏りが常にリスクとして存在するというさらなる問題も現れる。さらに、当然ながらビッグデータには、デジタル世界から疎外されている人々は含まれない。より裕福で、若く、教育水準の高い市民に偏っており、デジタル社会から取り残されている何十億という人々は、ビッグデータには反映されないのだ。

この点に関連し、ビッグデータの手法を適用する際、数々の倫理原則を考慮する必要がある。データは適正かつ合法的に収集され、利用されているか?適切な管理と説明責任プロセスを備えているか?データの質は高いか、それとも偏っているか?最小限のデータを利用しているか、それとも個人の権利、プライバシー、主体性を考慮することなく大量のデータを収集しているのか?

こうした懸念や考慮すべき問題があるものの、ビッグデータはスマートシティやより広範な国際開発に、真の機会を提供してくれる。ビッグデータの役割を検討する際、どのようなプロジェクトであっても考慮すべき点が、次の通り5つある。

  1. よりよいデータか?データで重要なのは規模よりも構成である。さまざまなグループが関与でき、参加していると感じられるプラットフォームによって収集したデータはより完全で、そうしたデータに基づく解決策は、より包括的である。ビッグデータには「権力者による恣意的な選択」という、特定のグループが排除される重大なリスクがあり、偏ったデータを学習させられた不公平なアルゴリズムによって、社会的不平等が拡大する恐れがある。
  2. 有効で正確なデータか?ビッグデータの価値は、信頼できる有効な測定結果を生成する能力にある。ビッグデータは、アンケートや行政データといった従来のデータと相互依存の関係にある。用途を限定しないデータであるため、従来の方法によるデータソースなどを通じて有効性を実証する必要性があるのだ。こうした従来のデータは、適切に収集・処理されたものであれば、ビッグデータの質を評価するベンチマークとして利用することができる。
  3. どのような種類の知識が必要か?他の種類のデータと同じく、ビッグデータも解釈するために処理を行い、統計、アルゴリズム、視覚などのモデルに合わせる必要がある。こうしたそれぞれの段階でデータに関する決定を下さなければならないが、そうした決定は中立的でない。たとえば、データセットにおいて何が「シグナル」で「ノイズ」なのかを区別し、データをクラスター化する方法を特定し、外れ値(データ解析上他の値から大きく外れた値)の対処方法を判断することは、重要な決定である。しかしこうした決定はどれも、それを下す個人の世界観や信念、先入観から影響を受ける。このリスクに対処するためには、そうした決定を個人に委ねるべきではない。データサイエンスの研究者は、性別、年齢層、民族性の異なる多様な社会科学者や他の専門家と協力していかなければならない。
  4. 背景状況なしに意味を持つか?ビッグデータは、それが生成される背景状況の中で、データに表れている個人の観点から解釈される必要がある。しかし、誰がデジタルプラットフォームにアクセスでき、そのプラットフォームがどのように利用されるのかを特徴づける社会規範や原則は、文化的要素、公平性の認識、およびデータの機密保護と結び付いている。とくにデータのパターンは、ユーザーの行動やデータ処理のプロセスにおける人為的な影響によって強調される可能性があるため、データがどのように提供されたかについての適切な技術的理解がとりわけ重要になるだろう。
  5. アクセス可能ではあっても、倫理に適ったものでもあるか?データを収集できるからと言って、それを収集しなければならないわけでも、利用すべきであるわけでもない。アクセス可能であることと倫理的であることとは同義語ではなく、特定のデータセットやデータソースを利用することで、個人や社会に取り返しのつかない重大な損害をもたらす可能性がある。そうした損害はデータの漏えい、無責任な共有、誤った報告によって悪化することもある。倫理的なデータの使用とは、データの収集、分析、使用において、尊厳と尊重、プライバシーを優先することである。それには、データの利用から個人が恩恵を得られるようにすることも含まれる。

ビッグデータは、国際開発におけるデータの利用方法について、根本的な再考の必要性を突き付けている。再考すべき部分には、関連するスキルやツール、プロセスも含まれる。しかし、あらゆるテクノロジーやイノベーションと同様に、ビッグデータも戦略的で、熟慮された、包括的な方法で利用されなければならない。それには、他の不平等において、デジタル格差をも生み出したり、悪化させ、固定させたりしないようにすることが含まれる。

ビッグデータはスマートシティの重要な要素であり、住民や他のステークホルダーの利益になるように都市機能を改善させるのに欠かせないだろう。私たちが行っているように、ビッグデータを利用して、インフォーマルな居住地や農村と都市のつながりを含めて、最も広い視野で都市を見ることもできる。ビッグデータが適切に利用されれば、すべての住民のために機能しうる都市空間の形成を促す可能性がある。

著者