PS3版eyeToy 「PLAYSTATION Eye」用ゲームムービー

次世代機の中では低処理性能でありながら、リモコンによる直感的入力が分かりやすく受けているWii。それに対して、PS2で圧倒的王者であったものの、PS3は高い処理能力を持っていながらこれといった目新しさを一般消費者に示せず、苦戦している印象があります。(値段とか、ソフトがないとか、そっちの要因ももちろん大きいですが。)

そんな「直感的操作」ですが、PS側もPS2のときにeyeToyというカメラを使ったゲームを出しています。日本ではそこまで大ヒットという感覚は無いですが、欧州ではかなり受けていたようです。自分の感覚としては、人間の動きを認識して入力に応用するヒューマンインタフェースの分野で、eyeToyは世界的に商業的には成功した好例だったように思いますね。

今でこそ「モーション認識=Wii」という印象ですが、SCEもカメラを使ったeyeToyでのアプローチもPS3では積極的に行っていこうとしている模様。そんな中、GC2007に併せて公開されたのがPS3eyeToyPLAYSTATION Eye」のゲームムービーです。

高解像度版はこちら→Gametrailers.com - PlayStation 3, PlayStation EYE Trailer HD

PLAYSTATION Eye自体は実世界指向カードバトルゲームの「THE EYE OF JUDGMENT」でも使われるわけですが、上記動画はまさにヒューマンインタフェースとして利用する例ですね。

HD解像度+高処理能力でグレードアップしたeyeToy

動画で紹介されているゲームとしては、一つはカメラで撮影された自分の手を使ってキャラクタを移動、ゴールに導くというもの。二つめの奴もボールをゴールに運ぶ系のゲームですが、自分の姿が複数の箇所に映っている感じですね。3つめの水槽のイメージでは、見えづらいですが、うっすらと人の姿が映っており、手で水面に波立たせたり、水槽の中をかき混ぜたりしている感じです。

グラフィックは、さすがPS3だけあって非常に綺麗ですね。水槽の奴も、最近Wiiフォーエバーブルーがでましたけど、やはり光の感じとかが段違いな感じです。ただ、ゲーム内容自体はeyeToyのときに多く見られたものと同様、どうも身体のシルエットを使った手によるアクション、というイメージがしますね。

カメラによる認識とコントローラによる認識の違い

カメラを使ったモーション認識というと、特徴的なことは「非接触である」ということです。利用者は専用に何か持つ必要がないという面もありますが、「逆に物を触らずに物を動かす」とかいうことが生じ、その触覚のなさ、フォースフィードバックの無さが逆に短所になるところもあります。Wiiリモコンの振動やスピーカというのは、入力に対する反応をプレイヤーにフィードバックするものとしては非常に効果的ですよね。カメラのみだと、こういうことができないのがネックです。

その代わり、コントローラの場合のデメリットは「持っているところのデータしかとれない」ということ。Wiiリモコンの場合、3軸加速度センサが一つ付いているわけですが、要するにデジタル的なデータとして分かるのはこのセンサの数値だけなわけです。WiiSportsで腕全体を早く振るより、手首でクイっと瞬時に倒した方が速い球が投げれたり打てたりするように、実際の身体の動きをすべて反映しているとは限らないんですよね。ドラゴンクエストソードなどの剣撃において縦・横の認識がむずかしいのもこの辺が原因かと思われます。一つのセンサの数字だけでは、振ったときに手首の向き、呼び動作、重力と加速度・遠心力の違いの把握などがごちゃごちゃに混ざってしまい、それこそ一定時間の連続な動作を一つの単位として厳密に区別するようなアプローチでないと、なかなか正確な認識は難しいわけです(参考:わぱのつれづれ日記 - Wiiのジェスチャ認識実装を助けるミドルウェア「LiveMove」)。

カメラの場合、実際のプレイヤーの手の位置、姿勢などをカメラ画像でとらえられることが、いろいろな可能性を秘めているかと思います。一応情報としては手の動きなどが全て画像としてPS3側に秒間30枚という量で入ってくるわけですからね。剣の振りなどでも、縦振り・横振りなどは画像から把握することが出来るでしょう。また、実際すでに今回のゲームムービーにもあるように、アクションが上側・下側のどちらで行われているかも認識できるわけです。

画像処理によるモーション認識の課題

ただ、カメラだから何でも認識できるか、というとそんな簡単な問題でもありません。今回のPLAYSTATION EyeeyeToyの時と同様、カメラが一つという仕様なので、出来ることは多少限られてきます。特に「前後の位置関係」についての認識は、一つのカメラだと結構むずかしくなってきます。この手の「距離感」の認識では2つ以上のカメラを使うことが一つの手なんですよね。人間が両目で距離感をつかんでいるのと同じ理屈で、二つの画像の微妙なずれに基づいて、画像内における前後の距離を把握するわけです。人間でも片目つぶると距離感つかみにくくなりますからね。もっとも、カメラ一つで距離感を認識する方法も、様々な研究がされているようですが。

あとは、「カメラに映らないところは認識できない」ということ。Wiiリモコンならモーション認識自体はプレイヤーがどこにいても認識できますが、TV側のカメラでの認識だとどうしてもプレイヤーの立ち位置が重要になってきます。カメラに写っていないとどうしようもないですしね。また、背中に隠れた腕の動きとかも、当然認識できません。こういった制約が起こるのが、カメラでの認識の欠点というところでしょうか。Wiiポインティングはリモコン側にカメラが付いており、センサーバーを撮影することでポイント位置を認識しており、いわばこれもカメラでの認識ですが、カメラがリモコン側についていることでTVにリモコンを向ける=カメラにセンサーバーが映ると関連付いているのが理にかなっていますよね。

それ以外だと、背景や照明条件などもいろいろ影響してきますね。照明が変われば色や人間の映り方(陰影など)も変わりますし、背景が変わればそちらを誤認識する危険も増えますし。純粋に「人の動きをセンシングする」という意味だと、どうしても装着型ハードデバイスの方がメリットがあると思います。

PS3ならでは」をどの程度発揮できるか?

以上、いろいろと述べてきましたが、この「PLAYSTATION Eye」はこれまでPS3でいまいち主張できていない「PS3らしさ」をアピールできるいい機会だと思います。カメラで撮った映像から、何を読み取るのか、これはインテリジェントにやろうとすればするほどCPUパワーが必要になってきます。Wiiリモコンから送られるセンサの数値などと比べれば、一回で処理しなければいけないデータ量が段違いなわけで、それだけCPUパワーが必要になるわけです。だからこそ、PS2eyeToyではあまり高解像度の画像は取り込めなかったんですよね。

その点、PS3はCellという強力なCPUを積んでいることは、カメラ画像認識という点では非常にメリットになってくるでしょう。こうした純粋なメディア処理には、高性能PCをも越える処理能力を持っているわけですしね(まあ、その分癖が強いようですが)。WiiのCPU能力ではせいぜいPS2程度のことしかできないでしょうから、カメラを使ったアプローチでは明らかにPS3側に分があるでしょう。そうした意味では、もしこの画像処理でのモーション認識でユニークで高度な認識が可能なら、Wiiに対してのアドバンテージになるかもしれません。

もちろん、インテリジェントな認識をするためには、それなりに学術的にも高いモーション認識技術が必要となります。ただ、このあたりはソニー自身が優秀な研究者をいろいろ抱えているので、そうした総合メーカーのメリットを生かせれば解決できる課題かもしれません。

ともかく、現状ではゲーム機としてみた場合、PS3は他のライバルより価格が高いことを埋められるだけのメリットを示せないでいます。目新しさではWiiに負け、グラフィックでは現状はXbox360に負けることが多いという状態ですからね。そんな中、PS3独自の強みといえば、なんだかんだ言ってもCellとBDということになるわけです。

現状すでに逆ざや状態で価格をそう簡単に下げられないPS3。AV関連はその価格を上回るほどの機能追加が進んでいるように、ゲーム機能関連でもその価格を「安い」と思わせるだけの魅力的な機能追加を期待したいところです。