「DCASE2020のtask2のfan(実測データ)」に対して「局所的位相シフト検出法」を行った場合

 自分は、信号源とセンサー(マイクロホン)の間に生じる予め測定できない不明な伝達特性をバイパスし、信号源内部の原信号を回復できる方法を考案し「局所的位相シフト検出法」と命名しました。

URL:https://sigprocrandwalk.hatenadiary.org/entry/20170722/1500751760
URL:https://sigprocrandwalk.hatenadiary.org/entry/2020/03/22/193447

 信号源に「非線形性」が作用していて各帯域間が独立していない場合(相互変調の状態)に、観測信号で得られる局所的な位相の進み遅れ量を用いて原信号を回復いたします。
 次に実測データである”DCASE2020”用に公開されたデータ( http://dcase.community/challenge2020/index )のうちfanに対して「局所的位相シフト検出法」を用いたところ、次のような結果を得ることができました。

 

URL:http://local-phase.com/others/etc/LPSD%E3%83%BCDCASE2020-fan.pdf

 

 ただし現状では「DCASE2020のfan」が実測データであることから回復後の正解が分かりませんので、上のURL先の文書に示したような仮説(fanの形状と材質で決まる固有振動(共鳴)を想定して、音声解析などで用いられるフォルマントと似た考え方を用いて結果の説明を試みています)を設けて、検討を続ける予定です。

 また今のところはあくまでも目視での確認ですが、確認できた特徴を評価関数化し、機械学習もしくは統計的分類手法に組み込んで性能を評価するつもりです。

 

園部和夫 [ aka SigProcRandWalk | SPRW , mailto : fuja2_at_bj8.so-net.ne.jp ]

「線形と非線形の間のギャップを埋める技術」に関するメモ

 題に挙げた「線形と非線形の間のギャップを埋める技術」を考えた時に
最初に思い浮かぶのは、やはり

1)「情報幾何学
  曲がった空間(個々のデータに非線形性が観察されることの裏返しと
  も考えられる)は、複数の連なる接空間(線形な空間)の関係性で
  表される

でしょう。
 現状で非線形性に取り組む際に利用できる唯一の道具立てなのでは
ないでしょうか。
 次には、

2)「白色雑音を搬送波に見立てる『変調・復調』」
  「変調・復調」は
  「信号が存在する『空間aの全体』と搬送波の近傍で表される
  『空間aの一部』との間の非線形写像」と考えることができる。
  更に
  「空間全体に非線形特性を作用させても、
  白色雑音とその近傍では、元の白色雑音の全体にゲインがかかった
  ような状態になり非線形にならないという特別な現象が起きる」
  また「白色雑音の特性を持つ実体としての雑音は無数にあるので、
  『空間aの全体』にに対して非線形特性が作用したとしても、実際に
  非線形特性がかかる範囲とかからない範囲とが、『一つの空間a』の
  中にまだら模様に混在することになる」
  であれば
  白色雑音を搬送波に見立てて
  「『空間aの全体』と白色雑音の近傍で表される『空間aの一部』
  との間の写像」が行えれば、信号が存在する空間全体に非線形
  特性が作用してても、白色雑音の近傍で表わされる線形性を保った
  空間で、信号に対する処理などが行えるようになる。

を挙げたいです。2)の「白色雑音を搬送波に見立てる『変調・復調』」は、
1)の「情報幾何学」とは異なるタイプ(動作メカニズムが異なり、おそらく
使い道も異なる)の道具立てになることは明らかです。
 2)は、

sigprocrandwalk.hatenadiary.org

 

に記載した内容を元に、特に「『変調・復調』とはどういう技術なのか」に
ついて考えを進めたものです。URL先にも書いてますが、査読などのチェックは
受けていませんので、書かれている内容や個別の実験の結果などをもとに
ご判断いただければと思います。査読無しという状況は面倒な話でほんと
申し訳ありません。全面的な肯定でなくても、まずは興味を持っていただければ
自分としては嬉しいです。
 世間的には「変調・復調」は枯れた技術と思われてますが、搬送波を
「単波長のピュアなサイン波」とする限定を外せば、まだ発展の余地がある技術
ではないでしょうか。
 しかしながら、調べてみて驚いたのですが、実は「復調」は、搬送波を
「単波長のピュアなサイン波」とするラジオ放送などで実用化済みの最も基本的な
内容でも、数学的な定式化は行われてないようです(自分が調べた範囲では
見つかりませんでした。もちろん実用化されてるわけですから手続き的なアルゴリズム
としての計算方法は明確ですが)。「復調」の取り扱いの難しさは「変調」に
含まれる非線形性が原因と思われますので、解決には「情報幾何学」が関係して
いてほしいなと強く期待しています。というかそれ以外の可能性を全く見つけられて
いない状況でして、線形と比べて非線形に対する道具立ての少なさを実感します。
 定式化がされていないということは、どういう状況でどの程度の性能が期待でき
るかなどは、実験事実の積み重ねに頼ることになります。例えばラジオ放送での
信号の帯域と搬送波の周波数との関係は、実験的に不都合が起きないように
設定されてるはずです。搬送波がサイン波だと信号処理におけるサンプリング定理
からの類推も効きやすいように思われます。
 では白色雑音を搬送波に見立てる場合だと、上に類することが一体どうなるのか、
想像することもなかなか難しいように思います。が、これから定式化が進めば、
信号処理におけるサンプリング定理に相当するような「何か」が「変調・復調」で
発見されるようなこともあるかもしれません。
 以上に述べた定式化は自分にとってはとても難しく高いハードルなのですが、
世の中にはこれらの定式化が自明のように思える人物もいるかもしれません
(それは能力の差と言うよりはその人物の持つ技術的な背景によるものと
思いたいですが)。ということで、以上のことが広く世間に伝わって、そういう人物
に辿り着き、議論が始まり活発になることを願って、ここに記すことにします。

 最後に、自分はどうしたいのだろうか、というのを一応書いてみようと思います。
 自分は普段はほぼ一品物のソフトウェア開発をしていますが、今回の話の自分
にとっての始まりである「信号検出方法としての『局所的位相シフト検出法』」
について、汎用のライブラリ(もしくはその発展形)を作って提供したいなと思っと
ります。まだ先になりそうですが、もしご興味のある方は[ fuja2_at_bj8.so-net.ne.jp ]
までご一報ください。
 あと、以上の話が、ここまで読んでいただいた方々の未来のアイデア出しの時にでも、
何かのネタになれば良いなと思っております。

園部和夫 [ aka SigProcRandWalk | SPRW , mailto : fuja2_at_bj8.so-net.ne.jp ]

 

甘利俊一先生へのお手紙

 甘利先生のご著書である「情報幾何学の新展開 新版」 (2019.11.25 発行)を拝読

しまして、今までの私の技術的な背景と合わさって、ぜひ先生にお伝えしたいと思える

話ができてきました。ただ私は先生の連絡先などを存じてないので、先生がエゴサーチ

なさることを期待しまして、次の一文をインターネット上に置くことにしました。

 インターネットにアクセス可能な多くの皆様には、まずは内容について興味を持って

いただき、ご笑覧いただければ嬉しく思います。

 

                            園部和夫 - 2020.3.22.Sun.

 

 

//////////////////////////////////////////////////////////////////////////////////////

甘利俊一 先生

 

 突然のお手紙をお許しください。

 私は「信号処理・画像処理」の分野で技術者として働いております園部和夫と申します。

 普段は学術的な世界とはあまり縁がないのですが、先生のご著書である「情報幾何学

新展開 新版」 を拝読することで、記載されている Neural Tangent Kernel ( NTK )

その大元である深層学習に大変な興味を持つことができました。こんなに興味を持たせて

いただいたことにとても感謝しております。先生の文章から伝わる熱量に触発されたもの

と勝手ながら思わせていただいています。

 

 NTK に関しまして、先生のご著書をきっかけに、ネット上にあるレジメや、原論文、

などにもなるべく目を通しました。そこで「 NTK に関する実験事実」を説明できる

「物理的な現象」が少なくとも一つありそうだということに思い当たりました。

内容として面白いと感じさせるものでしたので、先生にもぜひお知らせしたいと考えた

次第です。

 

 内容の本文と説明用の図は以下です。

 

  本文:中に「局所的位相シフト検出法」なる言葉が記載されてますが、

     以下の「/// 背景となる話 ///」でご説明いたします。

     URL : http://local-phase.com/others/etc/honbun-pdf.pdf

  図 :信号と白色雑音と最適解の一例を空間上にプロットした模式図

     URL : http://local-phase.com/others/etc/ksonobe-graph1.pdf

 

 キーとなる考え方は

 

  「白色雑音を搬送波と見立てて行う『変調・復調』」

 

となります。

 「白色雑音を搬送波と見立てて行う『変調・復調』」なる考え方が出てきた背景は次の

ようなものですが、もし「白色雑音を搬送波と見立てて行う『変調・復調』」を所与の

ものと考えていただけるようなら以下の話は無視していただいても結構と思います。

 

/// 背景となる話 ///

//

// 私は個人的に「局所的な位相の進み遅れ量」に注目して信号検出を行う方法

// を検討し、「局所的位相シフト検出法」と名前をつけて「特許の出願」(技術

// 資料として公開するという意味で出願しましたが、審査請求は行っていません)

// や「主に同業者(信号処理分野・画像処理分野に関わる方々)に向けての説明」

// などを行ってきました。論文などの発表は行っていませんので、査読を通じて

// のチェックなどは受けていないことになります。

// 「局所的位相シフト検出法」の検証実験の中に「白色雑音を搬送波と見立て

// て行う『変調・復調』」と同等と言って良いものが含まれていまして、個人的

// にはそこで「白色雑音を搬送波と見立てる」ことを強く意識しました。

//

// 「局所的位相シフト検出法」に関する資料は以下です。

// 

//  資料1:同業者(信号処理分野・画像処理分野)への説明に用いたレジメ

//         URL : http://local-phase.com/others/etc/siryo1-memo-20190729.pdf

//  資料2:「局所的位相シフト検出法」の概要

//        URL : http://local-phase.com/others/etc/siryo2-gaiyou-2017-sonobekazuo.pdf

//  資料3:「局所的位相シフト検出法」の検証実験

//        URL : http://local-phase.com/others/etc/siryo3-jikken-2017-sonobekazuo.pdf

//  資料4:「局所的位相シフト検出法」と「情報幾何学」を関連付けて考え

//      始め、読書会に参加した時の資料です。

//        URL : http://local-phase.com/others/etc/siryo4-InfoGeo-20190605.pdf

//

/// 背景となる話、終わります ///

 

 白色雑音(もしくは乱数。←今は両者を区別していません。NTKからの流れの話では

用語として乱数を用いてます)に着目した場合に、今後の深層学習がどういう風になるのか

以下で考えてみたいと思います。

 NTKに関する全体の流れとしては、

 

1)大規模個数のデータセットに対応したい

2)多数のP(パラメータ)が必要

3)多数のPを使うと極小解が生じる可能性が高い

4)3)の状況を避けられる NTK という考え方

5)NTKの実験事実を説明できる「白色雑音を搬送波に見立てる変調・復調」という考え方?

6)白色雑音(及び変調済み白色雑音)を取り扱うとなれば、(神経回路網の)機械学習にも

  今後はノイズ対策が必要になるのでは?

 

となりますが、最後の2項目が私が付け加えた項目で、まだ一般的な話ではありません。

 NTK で重要視されてる実験事実に「乱数の空間的な近傍に最適解がある」があるわけですが、

これは「乱数の空間的な近傍でいろいろと処理することになる」ことを意味するので、

それだけで「ノイズ対策は大事である」に繋がる話と言えます。

 更に「変調・復調」を念頭に置いて、白色雑音を取り扱う(NTKにおいては乱数の空間的な

近傍で何かをすることに相当)のであれば、適正なノイズ対策は必須です。それは間違いあり

ません(NTKとは方向の異なる話ではありますが「局所的位相シフト検出法」の検討では

実際に様々な工夫が必要になりました)。ですが、(神経回路網による)機械学習をメインに

検討してる方々は、ノイズ対策についてはまだあまり重要視してない(気にしてない)ように

見えます。

 いずれにしても NTK 以降の実験事実を踏まえれば、「乱数」もしくは「白色雑音」の取り

扱いが重要になると思われます。

 

 NTKの状況を見ていて、私は、深層学習の次の段階の課題は「ノイズ対策」で、解決される

のは

 

「大規模個数のデータセット(多数のPが必要)」で

「極小解問題は生じない状況を保って」かつ

「微少な差で行われる分類(など)」

 

のような問題ではないかと予想します。

 現状の深層学習でまだあまり成果が上がってない分野を思い浮かべていただいて、その中の

幾つかについては解決されることになるのではないでしょうか。

 

ノイズ対策をこまごまと考えれば、処理の階層に応じていろいろありますが、

現状で自然に導入できそうなノイズ対策の一例も一応は次のように考えられます。

(「白色雑音を搬送波に見立てる変調・復調」を意味として受け入れると、

 次のように自然に導入できる)

 

 以下は、学習アルゴリズムの部分では特別なことは行わず、最もシンプルな方法と言えます。

「学習」と「分類の判断」を白色雑音Nnに対応してそれぞれに行い、分類の対象である

信号SigTに対する判断結果ResSigTnを得ます。白色雑音の実体の数だけ複数の判断結果が

得られますので、最終的な判断結果を「投票」などで決めることができます。また判断結果の

分布が得られますので最終的な結果の確からしさも計算できます。

 性能の向上(例えば原理的な分解能や検出能を上げる、など)に白色雑音(もしくは乱数)

を利用することは様々な分野で考えられてますが、以上はその一例になるのかなと思います。

最終的に「投票など」は行うが、それまでは並列処理が可能。神経回路網での実行にも

 適してそう。

「白色雑音を搬送波と見立てて行う『変調・復調』」という考え方が念頭に無ければ

 出てこない話ではある。

 

 

 NTKの実験事実を説明できそうな一つの物理的な現象(「白色雑音を搬送波と見立てて

行う『変調・復調』」)に対して検討と説明を試みました。また、NTKの実験事実に現れる

乱数が重要な意味を持つ場合、もしくは「白色雑音を搬送波と見立てて行う『変調・復調』」

が正しい場合に、今後、深層学習のどの部分に改良が加えられていくのか予想してみました。

 もし何かお気づきの点などがございましたら、お教えいただけると大変ありがたいです。

 何卒よろしくお願い申し上げます。

 

 背景の話用に用意した資料4については、「情報幾何学」の創始者である先生にお見せする

には稚拙で恥ずかしいとも思ったのですが、「『情報幾何学』によりいろいろなことが線形

から非線形に拡張されるのかもしれない」と最初に感激した時のものですので、あえて

同封することにいたしました。ご笑覧いただければ幸いです。

 資料4を作成した時点での問題の捉え方は「信号検出方法としての『局所的位相シフト

検出法』を理解したい」だったのですが、一歩下がってみると解明されてない問題は実は

「変調・復調」なのか、とも考えるようになりました。「変調」はともかく「復調」の

方は、搬送波を「ピュアな単波長のサイン波」に限定した特別な場合でのみ実用化(ラジオ

TVの放送)されてますし、その場合も手続き的なアルゴリズムとしての処理方法は

明確ですが、数学的な定式化はどうもはっきりしてません(あれだけ生活に密着し定着

した技術なのに驚きですが、自分が調べた範囲ではよくわかりませんでした)。

 手続き的なアルゴリズムだけが判ってるという状況は「局所的位相シフト検出法」も同じな

ので他人事ではありません。「復調」の取り扱いの難しさは「変調」処理の非線形性に由来して

るように思えます。ですので「情報幾何学」の考え方を用いて整理できないかと愚考してると

ころです(私の能力的な問題もありまして、今のところは特に進捗のない状態ではありますが)。

 資料4については上の話も含めて、一見枯れた技術に見える「変調・復調」について、先生に

少しでも興味を持っていただければ良いなと思っております。

 

 

園部和夫

//////////////////////////////////////////////////////////////////////////////////////

 

音楽日記(ネットで見つけた曲のメモ)



↓2018年、今年一番の発見になりそうな予感


「 VULFPECK /// Cory Wong 」



「 VULFPECK /// Back Pocket 」



「 VULFPECK /// Animal Spirits 」





↓ちなみに2017年の自分的一番はこちら。アルバム"NBCP"買いました


「 Neighbors Complain-"Makes You Move" 」



「 Neighbors Complain-"Decision" Street Live Ver. 」



「 NEIGHBORS COMPLAIN - Night Drivin' 」


広報活動、その3


onsei-mailのみなさま、
重複してお受け取りの際は何卒ご容赦ください。


 以前に「『局所的位相シフト検出法』という信号処理方法
の応用先を探してます」と投稿しました〇〇と申します。
 その後、自分自身ではいろいろと考えまして「難聴状態で聴きやすい
音声の作成」に取り組んでみることにしました。
 難聴の方が音声を聴く時の代表的な状況としては


1)無声子音(「k」「s」「t」「p」など)が聴きとりにくい
2)騒音がある状況で全体として聴きとりにくい
3)反響のある状況で全体として聴きとりにくい
4)小さい音は聴きづらいが、同時に大きい音はうるさく聴こえる


などがあります。
 他方で「声紋」を計算する際に前投稿に記載した「局所的位相シフト検出法」
を用いたところ、


5)無声子音(「k」「s」「t」「p」など)が「声紋」上に
  高周波成分を含めて従来より明確に表れる。
6)母音などの有声音(声帯が音源+共鳴官としての声道と
  口腔の形状で決まる伝達特性)は、「声紋」上で周波数
  ピークが鋭くなり、周波数方向の弁別が良くなる。また
  音素としての時間方向の弁別が良くなる。
  乱反射があると周波数ピークが太ることは知られてるが
  上記はその逆に細くなっている。
  無声子音と母音を含む有声音とで効果の出方が異なること
  から単純な高周波成分の強調でないことも判る。
7)「局所的位相シフト検出法」を用いて「声紋」を計算する
  際に、実は「表示」用の明示的な対数変換は行っていない
  (フーリエ変換を用いて行う普通の「声紋」計算では表示
  する際に対数変換を行う)。
  「局所的位相シフト検出法」を作用させると自然に対数
  変換"様"の効果が加わっている可能性がある


などの特徴が得られてます。そこで「局所的位相シフト検出法」
を作用させて「声紋」を計算するのではなく、「音声」として
出力して聴いてみることにした次第です。<< http://local-phase.com/others/etc/Nanchou-Listen-20180115-sonobekazuo.pdf >>


今後のことはまだ詳しく定まっていませんが、機会がありましたら
ご鞭撻のほど何卒よろしくお願い申し上げます。失礼いたします。


On 2017/07/02 9:43, sonobe kazuo wrote:
> onsei-mailのみなさま、
> 重複してお受け取りの際は何卒ご容赦ください。
>
>
> はじめまして。〇〇と申します。
> 自分はある会社で医療用画像ビューワの開発に関わっております。
> 仕事として取り込んでいる画像関連とは直接の関係は薄いのですが、
> 個人的に、波形信号に対して局所的な位相の変化を用いて、
> 以下のような特徴を持つ信号検出の方法を考案しました。
>
>
> 1)伝達特性上では伝わることのない「微小信号」をソフトウェア的な後処理で検出できる
>   (伝わる信号のパワースペクトルの形状によらない。例えば伝わるのが白色雑音でも可能)。
> 2)非線形性により生じる「高調波歪み」と「混変調歪み」をソフトウェア的な後処理で除去できる。
> 3)上記は、信号源に非線形性があり異なる帯域間で相互変調が行われている場合に可能だが、
>   非線形性は現実の世界で自然な性質である。
>
>
> 自分はアカデミアの人間ではないので、そういった方面には発表していませんが、
> 総務省の「異能vation」プログラム [2015-2016] ( http://www.inno.go.jp/
> には応募しました。
> 採択はされませんでしたが、ポスターセッションにて発表しています。
> その時に作成した文書類は以下です。
>
>
> 「『局所的位相シフト検出法』- 異能ベーション応募資料」全体
> ( http://local-phase.com/others/InouVation/index.html
>
> 「応募資料」- [2015-2016]
> ・本文( 技術課題名[50文字以内] + 技術課題を乗り越えて実現したい目標[600文字以内] )
> ( http://local-phase.com/others/InouVation/honbun.txt
> ・「計算方法の説明」
> ( http://local-phase.com/others/InouVation/calc.pdf
> ・「検証実験の説明1」
> ( http://local-phase.com/others/InouVation/result1.pdf
> ・「検証実験の説明2」
> ( http://local-phase.com/others/InouVation/result2.pdf
>
> 「ポスターセッション資料」- [2016.3.4-5]
> ・ポスターセッション申込
> ( http://local-phase.com/others/InouVation/honbun_poster.txt
> ・「ポスター」
> ( http://local-phase.com/others/InouVation/inno-poster.pdf
> ・「ポスター 追加分」
> ( http://local-phase.com/others/InouVation/inno-poster-extra.pdf
>
> 「公開しているバイナリ」
> ・「わぶメモ」
> ( http://www.vector.co.jp/soft/winnt/edu/se478190.html
> ・「彩紋」
> ( http://www.vector.co.jp/soft/dl/winnt/edu/se479474.html
>
>
> 信号検出方法の原理的な提案ですので、応用範囲は広いと期待してます。
> 自分の考えが及ぶ範囲だと
>
> ・(より低域な)重力波の検出
> ・レーダーの高性能化
> ・ソナー(特にパッシブ)の高性能化
> ・宇宙背景輻射は本当に雑音なのか(位相変調的な特徴は残ってないか)
> ・脳波計の高性能化
> ・生体電位計の高性能化
> ・心電計の高性能化
> ・音声認識の高性能化
>
> などを挙げることができます。
> また思いもよらないような応用先が明らかになるようなら
> たいへん嬉しく思います。
>
> あと、今のところ計算機上で動かすためのプログラムはできていますが、
> 数学的にどのような意味なのか判ってない可能性はあります。
>