工学
今、「写真から3次元の立体を復元する」というテーマで勉強しています。線形代数が必要な分野で、こちらも並行して勉強し直しています。行列のランク、対称行列の対角化、特異値分解、……といったことが分かっていないと議論について行けません。今回紹介する…
久しぶりのブログ更新です。新年度でドタバタしていました。GW以降は写真から3次元復元する実験に入っています。前、条件を簡単にして2枚の写真から立体を復元する実験をやっており、結果も出しています。 www.omoshiro-suugaku.com 今回は、前には敬遠し…
バッチ正規化の実験(勾配確認)がうまくいったので、実際にMNIST(数字認識の実験のためのデータセット)を使って認識率がどうなるか試してみました。なお、バッチ正規化では正規化(標準化)の式として前回の記事の通りのもの(γ・(x-μ)/s+β)を用い…
バッチ正規化の話です。前回書いたとおり、画像認識のネットワークでデータを処理するとき、「各層で、特定のいくつかのユニットだけが値が大きくなる」という現象が起こります(「アクティべーションの分布が偏る」)。出力層でも「2」ばかりが出力されたり…
まだこのブログで紹介していなかった素晴らしい本です。『ゼロから作るDeep Learning』です。 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 作者:斎藤 康毅 オライリージャパン Amazon 何回か話題にしている数字認識の実験のセッ…
(Pythonのライブラリなどを一切使わない)画像認識の実験の中間報告です。 www.omoshiro-suugaku.com CIFAR-10を使って画像認識の実験をしていましたが、途中までは快調だったんですがつまずきました。いろいろがんばって光明が見えたので報告です。1人で書…
しばらくぶりの更新です。画像のデータセット、CIFAR-10を使って画像認識の実験(の準備)中です。 www.omoshiro-suugaku.com 前から凄く興味があって、とにかくやってみたかったのです。学校も冬休みに入り、時間もかなり自由になったので進んでいます。何…
重いし大きいし値段も高めなので、買うとき「うーん……、どうしよう」と考えました。 ディジタル画像処理 [改訂第二版] 公益財団法人画像情報教育振興協会(CG-ARTS協会) Amazon 索引まで含めて479ページ。読み終わってからレビュー、としていたら何年もかか…
CIFAR-10というデータセットがあります。前、MNIST(エムニスト)というデータセットを使ったことがあります。これは0から9までの数字認識の実験などのための画像のセットで、何年か前にC#でプログラムを書いて数字認識を試しました。CIFAR-10は飛行機、自…
すみません、この記事は周辺の知識がないと読みづらいと思います。機械学習、深層学習にソフトマックス関数というのが出てきます。今回はこれを微分したらどうなるか、という話です。ソフトマックス関数は次の通り。 ネットワークの出力層でユニットの値が …
ここのところ、機械学習の勉強をしています。ニューラルネットワーク、ディープラーニングも出てきます。これについては前、調べたことがあって、そのとき自分で数字認識まで実験しています。 www.omoshiro-suugaku.com www.omoshiro-suugaku.com 初めてだっ…
パターン認識の勉強を始めて、関係する「機械学習」について「そういえばこの辺、ちゃんと勉強したことなかったな……」と思い当たり、とりあえず何か読んでおこうか、と選んだ本です。 [改訂新版]ITエンジニアのための機械学習理論入門 作者:中井 悦司 技術評…
スマホに付いているカメラの話です。多分「オートフォーカス」というやつですよね? つまり、ピントが合っているとかいないとか気にしなくてもシャッターを押すだけで写真が撮れます。それとは別に、被写体が映っているとき、画面をタップするとそこにピタリ…
よさそうな本だけれど、買おうか買うまいか、それとも古本にしちゃおうか、借りて済まそうか……。迷うことがあります。あるいは近い内容の本が2冊あって、どちらにしたらよいか決めかねているとか。 ぼくはまず目次をザッと見て前書き、後書きを読みます。勉…
ここのところ、「2枚の写真から立体を復元する」というテーマで勉強しています。前、それなりに時間をかけてやっており、そのとき書いた記事も結構あります。 www.omoshiro-suugaku.com 今回、もう少しきちんと勉強して知識を整理しておこうと思いました。 …
一時期、「写真からもとの立体を復元」ということで少し勉強してブログにも実験の結果などを載せていました。今回、コンピュータビジョンの勉強をさらにきちんとしようと考え、必要な数学、特に線形代数を復習しています。 この分野では立体の回転の話が出て…
FFTの話なので、少し慣れていないと分かりづらいかも知れません。過去の記事がありますので、参照して下さい。 www.omoshiro-suugaku.com 画像は縦横がありますが、取りあえず横1列(1行)分の話をしましょう。対象の画像は横1列でNドットあるとします。各点…
この記事に直接関連した内容の書籍をブログ管理人が出版しました。記事をリファインして、極力詳しく解説しています。見ていただけるとうれしいです(2022年5月15日(日))↓ Python基本サウンドプログラミング~周波数分析,高速フーリエ変換(FFT)入門~ 作者…
前、こんな記事を書きました。 www.omoshiro-suugaku.com 確かに昔「トーンダイヤラー」みたいなグッズがあったようです。記憶もあります。送話器にこれを近づけて電話番号を指定すると「ピポパピピ……」のような音が出て、自分で電話番号を押さなくてもよい…
FFT(高速フーリエ変換)はデータ数が2の累乗のときに使える方法です。DFTにはそういう制限はありません。最近何回かFFTについて記事を書きました。それによると2の累乗が仮定されているのです。しかし、実際にSciPyのFFTに500データを渡しても無事に(?)F…
FFTのバタフライ演算についてまとめます。「自分で勉強したけれど難しかった」という方、ご覧ください。前回、前々回の記事からの続きです。 www.omoshiro-suugaku.com www.omoshiro-suugaku.com FFT(高速フーリエ変換)とは、DFT(離散フーリエ係数)に高…
今、FFT(高速フーリエ変換)の原理を整理しています。勉強のための書籍としてすでに紹介の記事を書きました。 www.omoshiro-suugaku.com 分かりやすく素晴らしい本ですが、どこからビットリバースがでてくるのか、については触れていません。ビットリバース…
FFT(高速フーリエ変換)を勉強中の皆様! 大抵の本に「バタフライ演算」というものが出てきますよね。難しいです。たくさんの本があり、筆者の先生方は頑張って易しく書いてくださっていると思うんですが、ぼくには難しいです。PythonならNumPyやSciPyに…
生徒は夏休みが終わりました。ぼくも本は結構読みました。最近買ったのがこれ。 藤井聡太論 将棋の未来 (講談社+α新書) 作者:谷川浩司 講談社 Amazon ここのところ将棋の藤井聡太の活躍がすごいです。将棋はぼく自身も指しますし、羽生が7冠を制覇した頃(1…
コロナのニュースで「移動平均」という言葉を最近(?)聞くようになりました。何だろ?と思ったら、例えば最近7日分の感染者数の平均を毎日求めるようなとき、そう言うようです。確かに、1日ごとの変化を追いかけても、いろんな事情で変化の仕方は様々、偶…
もうすぐ今年度初めての授業です。「授業開き」と言うようですね。この言葉、ぼくは今まで使ったことがありませんが。小中で使われているのかも知れません。ぼくの担当は数学なので大抵何かテーマを決めて「こんなに楽しいことがあります」みたいな話をいく…
面白い本でした。強くお勧めします。特にデフィー・ヘルマン鍵交換の例え話が気に入りました。もちろん例え話ですから限界はありますが、ポイントをよく捉えていて驚きました。ときどき生徒にも話します。面白がる子もいます。今回はこれを紹介します。今、…
去年、2枚の写真から立体を復元、というテーマでいろいろやっていました。 www.omoshiro-suugaku.comこの記事では「写真に頂点の(相対的な)位置が分かっている立体が写っている」という条件付きで立体を再現しました(ちゃんとできたのでかえってビックリ…
ハッシュ値について前、簡単に説明しました。 www.omoshiro-suugaku.com 「このデータは誰か改ざんしていないだろうか?」という疑問に対して、ハッシュ関数が答えてくれます。ハッシュ関数はチェックサムのようなものです。チェックサムとは、データ(数値…
ビットコインが面白そうです。いや、投機の対象?になるのかどうか知りませんがそっちにはあんまり興味はなく、技術面のことです。本も読み始めたんだけれどまだ進んでいません。 www.omoshiro-suugaku.com 今回はそういう状態ではありますが理解している部…