May 30, 2023
WiMi ホログラム クラウドは、ディープラーニングとニューラル ネットワークに基づいた効率的な CGH テクノロジーを開発しました
北京、2023 年 6 月 9 日 /PRNewswire/––世界をリードするホログラム拡張現実 (「AR」) 技術プロバイダーである WiMi ホログラム クラウド Inc. (NASDAQ: WIMI) (「WiMi」または「当社」) は本日、新しいそして
北京、2023 年 6 月 9 日 /PRNewswire/––世界をリードするホログラム拡張現実 (「AR」) 技術プロバイダーである WiMi ホログラム クラウド Inc. (NASDAQ: WIMI) (「WiMi」または「当社」) は本日、新しいディープラーニングとニューラルネットワークテクノロジーを通じたコンピューター生成ホログラフィー (CGH) のより効率的なソリューション。 深層学習は、運用中に最適解または局所最適解を見つけることができるため、CGH の計算が効率的になります。 CGHはホログラフィックライトトラップ、3Dディスプレイ、平面集光器、ARディスプレイなどに応用されています。
CGH テクノロジーは、カスタム ライト フィールドを逆解くことで最適な波動変調を得ることができます。 画質は SLM 変調の精度によって制限されるため、通常、ターゲットのライト フィールドを表現するのは困難です。 実際には、計算ホログラムの解は常に近似的であり、最適にエンコードされた波面を取得するために実行可能なホログラムを決定するには数値的手法が必要です。 CGH の現在の計算では通常、反復アルゴリズムが使用され、非反復手法は GS アルゴリズムを進化させることで計算時間を節約するように設計されています。 改善にもかかわらず、これらの非反復法は、散乱ノイズ、ダウンサンプリング効果、および共役画像干渉により、再構成中に常に画質の低下と空間解像度の低下を引き起こします。 深層学習技術を使用する場合、CGH 問題に対して U-net 構造が試みられ、最初は成功しましたが、計算論的ホログラフィック問題で U-net によって得られたホログラムには、再構成された画像の品質が低下するという欠点がありました。 従来の畳み込みニューラル ネットワークは、畳み込みフィルターと非線形活性化関数に依存しています。これは、処理されたデータが線形分離可能であると想定されることを意味します。 しかし、画像符号化、ホログラフィック暗号化、周波数解析などの問題は線形に割り切れる関数で記述することが難しく、単純な畳み込みや逆畳み込みは演算効率を高めるために常に一定の領域に限定されます。 U-net がグローバル情報を利用したり書き換えたりできないということは、光学画像処理が非常に弱いことを意味します。
WiMi は、従来の CGH 手法の長い計算サイクルと低品質の問題を解決することを目的とした、深層学習ベースの CGH イメージング手法である効率的なコンピュータ生成ホログラフィ (ECGH) テクノロジを開発しました。 この方法では、計算ホログラフィック イメージングに混合線形畳み込みニューラル ネットワーク (MLCNN) を使用し、ネットワークに完全接続層を導入することで情報マイニングと情報交換を強化します。
このネットワークは、ライン フォーク層を備えた MLCNN 構造、ダウンサンプリング用の「DownSample」構造、およびアップサンプリング用の「UpSample」構造を使用します。 この技術は、ニューラル ネットワーク モデルを使用して入力ターゲット光場を計算し、位相値を計算して光学実験結果をシミュレートします。 損失関数を使用してターゲットの光場とシミュレーション結果が比較され、損失値の勾配が計算されて逆伝播され、ネットワーク パラメーターが更新されます。
WiMi の ECGH メソッドは、高品質のホログラフィック イメージングを生成するために必要な純粋位相画像を迅速に取得できます。 従来の深層学習ベースの CGH 手法と比較して、WiMi の ECGH テクノロジーはネットワーク トレーニングに必要なパラメータの数を約 60% 削減できるため、ネットワークの効率と信頼性が向上します。 さらに、ECGH 技術のネットワーク構造は汎用性が高く、さまざまな画像再構成問題の解決に使用できるため、高い実用性と応用の可能性があります。
WiMi の ECGH 画像は、ホログラム生成をより高速に計算できる非反復深層学習モデル MLCNN を使用しています。 ECGH法の適用に成功することで、高品質で安定した計算ホログラム画像が得られます。 MLCNN 構造の主な特徴は、データの領域間交換を計算できることであり、これにより、グローバル情報の操作を必要とする複雑な光学機能に適しています。 WiMi の ECGH テクノロジーに MLCNN モデルを適用すると、複雑な光機能を効果的に処理できます。 このモデルは、高品質のホログラフィック画像を生成するために、さまざまな複雑な光学機能を処理できます。 このホログラフィック画像は 3D シーンを完全に再現することができ、観察者により現実的な視覚体験を与えます。 MLCNN モデルは、U-net ネットワーク構造よりも優れた光ドメイン適応を備えています。 これにより、複雑な光学機能と光学領域の変化をより適切に処理できるため、ホログラフィックの生成と再構成に利点がもたらされ、CGH は 3D シーンの能力を完全に再現し、視覚疲労を防ぐことができます。