RoboCup@Home/2010-12-19のメモ
[
Front page
] [
New
|
List of pages
|
Search
|
Recent changes
|
Help
] [
Japanese
/
English
]
Research
research overview
papers
media
Members
professors
graduates
undergraduates
alumni
Links
Links
Classes
Computer Programming Basic II
Special Lecture of Mechanical Intelligent System Engineering I
Start:
[[RoboCup@Home]]
#contents
*とりあえずメモ開始 [#x1be34c9]
-玉川大・知能ロボットセンター 大森先生
-金沢工大出村先生:夢工房。中型部門。
-大阪工大佐野先生:インタラクションとか
-九工大大橋先生:2009年RSJで話した(HoRay?)
-下斗米貴之さん@玉川大
-(石井先生:つくチャレも出てる。九工大?福井高専?)
-海外勢(特にヨーロッパ)は、ちゃんと論文も書いてる。
-2011年のエントリーは、1月13日だったか。
*杉浦さん(NICT) [#c5d12575]
-24チーム。15の国。
-ルール:1~3月にドラフト。4~6月:最終版。
-オフィシャルHP:@Home wiki にデバイス情報とか載ってる。
*岡田先生 [#i73da4db]
-西濃運輸は安い。日通は確実だけど高い。
-2006年ブレーメンでデモをしてたのが最初。
-再来年はメキシコ。
-ジャパンオープン。2011年5月3日(火)~5日(木)
--インテックス大阪
--仮登録:1月14日(金)までに意思表示(やーめたでもOK)
--本登録:3月初旬
--参加費の支払い:4月初め
---会員外15000円、会員8000円、学生会員5000円とか
---ロボカップの会員:学生は最初に一回だけ払えばOK。
--仮登録:チーム名、所属、人数(会場に来る人数)、代表者...
--ルールを簡素化したチャレンジ種目ができたらよい。
-世界大会
--2011年7月5~11日イスタンブール
--2012年メキシコシティ
--12月末:仮エントリー
--1月頃:ルール発表
--2月頃:TDP(Team Description Paper)、写真、ビデオなど
--3月頃:書類選考結果(OCが選ぶ)
--書類選考は、
---@home の wiki に contribution があるかも、チェックされ...
---研究的な要素(特に併設シンポジウムでの発表)も、結構重...
---どのリーグがシンポジウムにどのくらい出してるかとか気に...
*タスク説明 [#v7ce6520]
-GoGetIt(未知の部屋内探索)
-Enhanced Who's Who
-Who's Who 顔認識:おかおビジョン(オムロンとか)
*音声認識について。 [#rec1179f]
-やっぱ、音声じゃなけりゃいけないとする必要性が、あまり感...
-音声は便利だけど、UIとして接触系でもいいと思う。
-ビジョンは必須だと思うから良いと思う。~
⇒
--ロボットに触ってはいけないというのが大原則
---「操縦」をできてしまう可能性を排除できないから。
--2次元バーコードとかはだめ。
---というか、external object を持ち込むのは禁止。
---また、チームメンバーじゃない人がやるから、
これをして欲しいとかは難しい。
歩き方とかも人によって違う。
--ジェスチャーは、全身を使ってもいいんじゃない?
---でも、きっと、ジェスチャーで操縦できるようにしては、だ...
--full autonomous が大原則。
-韻律は認識に使っていないので、韻律が違っても認識できる。
-鉛のある英語。関西弁の日本語。
*OKAOビジョン [#md25f7d2]
-年齢、性別、笑顔度
-アジア系なら90%くらい。黒人は苦手。
-年齢・性別・感情とか、外国人に受けが良い。
*GPSR (general purpose service robot) [#cdfd71ad]
-カテゴリ1:3つの命令を1つの文で。ロボットは質問禁止。
-カテゴリ2:命令には情報が明らかに不足。適切な質問を発話。
-カテゴリ3:明らかに実行不可能な命令(コップが無いとか)。
--どう対策したか等で評価。
-行動まで移せたロボットはいなかった。認識に成功したチーム...
-今後も続ける予定。メタタスクなので、
--ステージ1のタスクが変わっても、その中からピックアップ...
*DemoChallenge [#z262894f]
-2008年:キッチンで人の支援をするロボット
-2009年:バーで活躍するロボット
-2010年:バーやレストランで活躍するロボット
-2011年:洗濯物系の予定らしい。
*視線とか検出してなんとかしようというチームもありそうだな...
*杉浦さん:音声認識 [#z2391af7]
-タイムアウトを入れましょう。
-Rの発音は認識されにくい。
-オンボードのマイクだとボーナスポイントがつく。
-知らない人が何を言うかわからない場面は非常に難しい。
-VAD (voice activity detection)
-80dBA では 生波形を人が見てもVAD難しい。
-雑音抑圧が重要。
--雑音の種類は展示会ノイズ。(無ければ、音楽でも良いだろ...
-マイク:Sanken CS-3e(あの細長いやつ)
--正面のみ。マイクロホンアレイ。
--ADコンバーターは非常に重要:M-AUDIO Mobile Pre USB
-代替案
--Bluetoothヘッドセット(ボーナスは付かないけど、お手軽)
--マイクロフォンアレイ
--カラオケマイクを有線で
-スピーカー:
--かなり高出力じゃないと、レフェリーに聞き取ってもらえな...
--Yamaha NX-U10 を使っている。(20Wくらい)
--会場スピーカーがあるはずだけど、使えない場合も多いらし...
-音声認識エンジン:ATRASR (ATRが開発しNICTが引き継いだ)
--雑音抑圧に非常に強い。(周波数ベース)
--音響モデル(HMM)が良い。
--80dBAではモータ音なんて全く聞こえない。
--NICTと共同研究の枠組みで使える (Aladin(10万円))
--ATRがNICTに丸ごと移った。100万円でRT-middlewareで売って...
-音声合成エンジン:XIMERA
-代替案:
--Julius (英語は自分で作る必要)
--Dragon Speech (3万円)
--Apple の音声合成(結構品質が良い)
--Festival フリーの音声合成(品質はイマイチ)
--([[HARK>http://winnie.kuis.kyoto-u.ac.jp/HARK/]]は、今...
-未登録語の認識
-動作の一般化:HMM, EMアルゴリズム
-日本人がしゃべった英語を認識できるエンジンはほとんど無い。
--しゃべった人に合わせて音響モデルが自動的に選択される。
--チームメンバーがしゃべって良い場面もあるから、認識率の...
--発話の方も、英語として自然な言い回しかをチェック。
*長井先生:ビジョン [#vf9bf363]
-基本はOpenCV
-DiGOROのシステム:
--6台のPC。OpenRTMやROSは今の所使ってない。
--モジュール化は必須。
-重要なのは、物体検出。顔検出。
--顔はOpenCVのHAARライク特徴&Boostingでいける。
-でも、今は、オムロンの「おかおビジョン」
-まず、机の平面を探し、その上を探す。
--机の平面が見つからないときだけ、色とか使う。
-局所特徴量は、PCA-SIFTを使ってる。他のチームもSIFTかSURF。
-顔は、以前は、・・
-インテグレーションの基本方針
--マルチスレッドで並列に計算して認識結果をネットワークに...
-Kinectはかなり良い。SR4000よりは良いだろう。
-Kinect+OpenCVが最強だろう。
-20種類の物体のうち、色々ある。
--モノが発表されたらすぐにスーパーに買いに走るべき。
-ビジョンの一段メタなモジュールがあると良い。
-【チェックシート】がかなり効いている。
--最初に立ち上げるプログラムとか、確認する手順とか。
--2人ペアになって確認するとか。
-Nimbro (SuperMarcketとかやってたやつ) の方が
--ロボット的には上だと思うけれど、eR@sersが勝てたのは
--チェックシートとか効いていると思う。
*下斗米貴之さん@玉川大(しもとまい):ロボット本体 [#d9e7e...
-サーバを介してモジュール間がやり取り。
-タスクも1つのモジュール(クライアント)
-足回り:メカナム。横移動可能。
--ホロノミックなのが良い。
--前に使っていたのは、iXisのiWsだったか、Pioneer P3DX
-緊急停止ボタンは、押されてるとランプが消えるとか、
--そういうのが良さそうだ。
-[[MRPT.org (Mobile Robot Programming Toolkit)>http://mrp...
--幾何シミュレータ
--ログ解析ツール
--SLAMのパラメータとか
-URG 視野角240度。
-マニピュレーション。
--例えば、9割の確率のことを9個全て成功させて初めて、
---ペットボトルを取れる。(expt 0.9 9) => 0.387
-デバッガ。シミュレータ。
-SLAMの精度とかはどのくらいなの?
--(ヒューマノイドや中型は10cmくらい)
--SLAMだけで動けるわけでもないし、微調整は別モジュールで...
*村永さん@セック:OpenRTM (テレビ会議ではちょくちょく) [...
-用賀。創業40年。独立系ソフト会社。前は宇宙とかやってた。
-組み込みCORBA: H8等。TOPPERS/JSP
-Proxyコンポーネント:PIC, H8S (作れっていうこと?)
-Rtcshell/rtsshell (RTC管理のためのシェル?)
-''ROSとの比較''
--WindowsはCygwinでしか動かない。
--ライブラリ的な使い方。mainの中から、APIを呼ぶ。
--トピック(垂れ流し(受信側が選択))とサービス(単発リ...
--サードパーティ製モジュールは、RTミドルウェアはまだまだ。
---ROS.orgのリポジトリで集中管理。パッケージ依存関係も管...
--ライセンス:RTMはEPL。ROSはBSD。
--対応ハードはPR2に特化。(本当?)
-[[OpenRAVE>http://openrave.programmingvision.com/index.p...
-@ホームに使えそうなRTC:(OpenHRI系)
--PulseAudioOutput, OpenJTalk
--Jullius
--URG, Camera, HumanRecog
--HumanFollow
-学生チームと、セック・岡田先生チーム(?)とで、並行して...
-PythonベースのRTCがある。(末広先生?)
*岩橋さん(NICT) [#v3998c82]
-次の人工知能学会全国大会でオーガナイズドセッションをやる。
-マルチモーダル知能とインタラクション?記号?
-記号創発ロボティクスとマルチモーダルセマンティックインタ...
-6月1~3日。盛岡。発表申し込み1月27日。
End:
[[RoboCup@Home]]
#contents
*とりあえずメモ開始 [#x1be34c9]
-玉川大・知能ロボットセンター 大森先生
-金沢工大出村先生:夢工房。中型部門。
-大阪工大佐野先生:インタラクションとか
-九工大大橋先生:2009年RSJで話した(HoRay?)
-下斗米貴之さん@玉川大
-(石井先生:つくチャレも出てる。九工大?福井高専?)
-海外勢(特にヨーロッパ)は、ちゃんと論文も書いてる。
-2011年のエントリーは、1月13日だったか。
*杉浦さん(NICT) [#c5d12575]
-24チーム。15の国。
-ルール:1~3月にドラフト。4~6月:最終版。
-オフィシャルHP:@Home wiki にデバイス情報とか載ってる。
*岡田先生 [#i73da4db]
-西濃運輸は安い。日通は確実だけど高い。
-2006年ブレーメンでデモをしてたのが最初。
-再来年はメキシコ。
-ジャパンオープン。2011年5月3日(火)~5日(木)
--インテックス大阪
--仮登録:1月14日(金)までに意思表示(やーめたでもOK)
--本登録:3月初旬
--参加費の支払い:4月初め
---会員外15000円、会員8000円、学生会員5000円とか
---ロボカップの会員:学生は最初に一回だけ払えばOK。
--仮登録:チーム名、所属、人数(会場に来る人数)、代表者...
--ルールを簡素化したチャレンジ種目ができたらよい。
-世界大会
--2011年7月5~11日イスタンブール
--2012年メキシコシティ
--12月末:仮エントリー
--1月頃:ルール発表
--2月頃:TDP(Team Description Paper)、写真、ビデオなど
--3月頃:書類選考結果(OCが選ぶ)
--書類選考は、
---@home の wiki に contribution があるかも、チェックされ...
---研究的な要素(特に併設シンポジウムでの発表)も、結構重...
---どのリーグがシンポジウムにどのくらい出してるかとか気に...
*タスク説明 [#v7ce6520]
-GoGetIt(未知の部屋内探索)
-Enhanced Who's Who
-Who's Who 顔認識:おかおビジョン(オムロンとか)
*音声認識について。 [#rec1179f]
-やっぱ、音声じゃなけりゃいけないとする必要性が、あまり感...
-音声は便利だけど、UIとして接触系でもいいと思う。
-ビジョンは必須だと思うから良いと思う。~
⇒
--ロボットに触ってはいけないというのが大原則
---「操縦」をできてしまう可能性を排除できないから。
--2次元バーコードとかはだめ。
---というか、external object を持ち込むのは禁止。
---また、チームメンバーじゃない人がやるから、
これをして欲しいとかは難しい。
歩き方とかも人によって違う。
--ジェスチャーは、全身を使ってもいいんじゃない?
---でも、きっと、ジェスチャーで操縦できるようにしては、だ...
--full autonomous が大原則。
-韻律は認識に使っていないので、韻律が違っても認識できる。
-鉛のある英語。関西弁の日本語。
*OKAOビジョン [#md25f7d2]
-年齢、性別、笑顔度
-アジア系なら90%くらい。黒人は苦手。
-年齢・性別・感情とか、外国人に受けが良い。
*GPSR (general purpose service robot) [#cdfd71ad]
-カテゴリ1:3つの命令を1つの文で。ロボットは質問禁止。
-カテゴリ2:命令には情報が明らかに不足。適切な質問を発話。
-カテゴリ3:明らかに実行不可能な命令(コップが無いとか)。
--どう対策したか等で評価。
-行動まで移せたロボットはいなかった。認識に成功したチーム...
-今後も続ける予定。メタタスクなので、
--ステージ1のタスクが変わっても、その中からピックアップ...
*DemoChallenge [#z262894f]
-2008年:キッチンで人の支援をするロボット
-2009年:バーで活躍するロボット
-2010年:バーやレストランで活躍するロボット
-2011年:洗濯物系の予定らしい。
*視線とか検出してなんとかしようというチームもありそうだな...
*杉浦さん:音声認識 [#z2391af7]
-タイムアウトを入れましょう。
-Rの発音は認識されにくい。
-オンボードのマイクだとボーナスポイントがつく。
-知らない人が何を言うかわからない場面は非常に難しい。
-VAD (voice activity detection)
-80dBA では 生波形を人が見てもVAD難しい。
-雑音抑圧が重要。
--雑音の種類は展示会ノイズ。(無ければ、音楽でも良いだろ...
-マイク:Sanken CS-3e(あの細長いやつ)
--正面のみ。マイクロホンアレイ。
--ADコンバーターは非常に重要:M-AUDIO Mobile Pre USB
-代替案
--Bluetoothヘッドセット(ボーナスは付かないけど、お手軽)
--マイクロフォンアレイ
--カラオケマイクを有線で
-スピーカー:
--かなり高出力じゃないと、レフェリーに聞き取ってもらえな...
--Yamaha NX-U10 を使っている。(20Wくらい)
--会場スピーカーがあるはずだけど、使えない場合も多いらし...
-音声認識エンジン:ATRASR (ATRが開発しNICTが引き継いだ)
--雑音抑圧に非常に強い。(周波数ベース)
--音響モデル(HMM)が良い。
--80dBAではモータ音なんて全く聞こえない。
--NICTと共同研究の枠組みで使える (Aladin(10万円))
--ATRがNICTに丸ごと移った。100万円でRT-middlewareで売って...
-音声合成エンジン:XIMERA
-代替案:
--Julius (英語は自分で作る必要)
--Dragon Speech (3万円)
--Apple の音声合成(結構品質が良い)
--Festival フリーの音声合成(品質はイマイチ)
--([[HARK>http://winnie.kuis.kyoto-u.ac.jp/HARK/]]は、今...
-未登録語の認識
-動作の一般化:HMM, EMアルゴリズム
-日本人がしゃべった英語を認識できるエンジンはほとんど無い。
--しゃべった人に合わせて音響モデルが自動的に選択される。
--チームメンバーがしゃべって良い場面もあるから、認識率の...
--発話の方も、英語として自然な言い回しかをチェック。
*長井先生:ビジョン [#vf9bf363]
-基本はOpenCV
-DiGOROのシステム:
--6台のPC。OpenRTMやROSは今の所使ってない。
--モジュール化は必須。
-重要なのは、物体検出。顔検出。
--顔はOpenCVのHAARライク特徴&Boostingでいける。
-でも、今は、オムロンの「おかおビジョン」
-まず、机の平面を探し、その上を探す。
--机の平面が見つからないときだけ、色とか使う。
-局所特徴量は、PCA-SIFTを使ってる。他のチームもSIFTかSURF。
-顔は、以前は、・・
-インテグレーションの基本方針
--マルチスレッドで並列に計算して認識結果をネットワークに...
-Kinectはかなり良い。SR4000よりは良いだろう。
-Kinect+OpenCVが最強だろう。
-20種類の物体のうち、色々ある。
--モノが発表されたらすぐにスーパーに買いに走るべき。
-ビジョンの一段メタなモジュールがあると良い。
-【チェックシート】がかなり効いている。
--最初に立ち上げるプログラムとか、確認する手順とか。
--2人ペアになって確認するとか。
-Nimbro (SuperMarcketとかやってたやつ) の方が
--ロボット的には上だと思うけれど、eR@sersが勝てたのは
--チェックシートとか効いていると思う。
*下斗米貴之さん@玉川大(しもとまい):ロボット本体 [#d9e7e...
-サーバを介してモジュール間がやり取り。
-タスクも1つのモジュール(クライアント)
-足回り:メカナム。横移動可能。
--ホロノミックなのが良い。
--前に使っていたのは、iXisのiWsだったか、Pioneer P3DX
-緊急停止ボタンは、押されてるとランプが消えるとか、
--そういうのが良さそうだ。
-[[MRPT.org (Mobile Robot Programming Toolkit)>http://mrp...
--幾何シミュレータ
--ログ解析ツール
--SLAMのパラメータとか
-URG 視野角240度。
-マニピュレーション。
--例えば、9割の確率のことを9個全て成功させて初めて、
---ペットボトルを取れる。(expt 0.9 9) => 0.387
-デバッガ。シミュレータ。
-SLAMの精度とかはどのくらいなの?
--(ヒューマノイドや中型は10cmくらい)
--SLAMだけで動けるわけでもないし、微調整は別モジュールで...
*村永さん@セック:OpenRTM (テレビ会議ではちょくちょく) [...
-用賀。創業40年。独立系ソフト会社。前は宇宙とかやってた。
-組み込みCORBA: H8等。TOPPERS/JSP
-Proxyコンポーネント:PIC, H8S (作れっていうこと?)
-Rtcshell/rtsshell (RTC管理のためのシェル?)
-''ROSとの比較''
--WindowsはCygwinでしか動かない。
--ライブラリ的な使い方。mainの中から、APIを呼ぶ。
--トピック(垂れ流し(受信側が選択))とサービス(単発リ...
--サードパーティ製モジュールは、RTミドルウェアはまだまだ。
---ROS.orgのリポジトリで集中管理。パッケージ依存関係も管...
--ライセンス:RTMはEPL。ROSはBSD。
--対応ハードはPR2に特化。(本当?)
-[[OpenRAVE>http://openrave.programmingvision.com/index.p...
-@ホームに使えそうなRTC:(OpenHRI系)
--PulseAudioOutput, OpenJTalk
--Jullius
--URG, Camera, HumanRecog
--HumanFollow
-学生チームと、セック・岡田先生チーム(?)とで、並行して...
-PythonベースのRTCがある。(末広先生?)
*岩橋さん(NICT) [#v3998c82]
-次の人工知能学会全国大会でオーガナイズドセッションをやる。
-マルチモーダル知能とインタラクション?記号?
-記号創発ロボティクスとマルチモーダルセマンティックインタ...
-6月1~3日。盛岡。発表申し込み1月27日。
Page: