WiMi 홀로그램 클라우드, 딥러닝과 신경망 기반 효율적인 CGH 기술 개발

블로그

홈페이지홈페이지 / 블로그 / WiMi 홀로그램 클라우드, 딥러닝과 신경망 기반 효율적인 CGH 기술 개발

Jun 02, 2023

WiMi 홀로그램 클라우드, 딥러닝과 신경망 기반 효율적인 CGH 기술 개발

베이징, 2023년 6월 9일 /PRNewswire/– 선도적인 글로벌 홀로그램 증강 현실("AR") 기술 제공업체인 WiMi Hologram Cloud Inc.(NASDAQ: WIMI)("WiMi" ​​또는 "회사")가 오늘 새로운 제품을 발표했습니다. 그리고

베이징, 2023년 6월 9일 /PRNewswire/– 선도적인 글로벌 홀로그램 증강 현실("AR") 기술 제공업체인 WiMi Hologram Cloud Inc.(NASDAQ: WIMI)("WiMi" ​​또는 "회사")가 오늘 새로운 제품을 발표했습니다. 딥러닝과 신경망 기술을 통해 컴퓨터 생성 홀로그래피(CGH)를 위한 보다 효율적인 솔루션을 제공합니다. 딥러닝은 운용 중인 최적 또는 로컬 최적 솔루션을 찾을 수 있어 CGH를 효율적으로 계산할 수 있습니다. CGH는 홀로그램 라이트 트랩, 3D 디스플레이, 평면 집광 장치, AR 디스플레이 등에 적용되었습니다.

CGH 기술은 맞춤형 광장을 역해석하여 최상의 파동 변조를 얻을 수 있습니다. 이미지 품질은 SLM 변조의 정확성에 의해 제한되며 일반적으로 목표 광장을 표현하기가 어렵습니다. 실제로 계산 홀로그램의 솔루션은 항상 대략적이며 최상의 인코딩된 파면을 얻기 위해 실행 가능한 홀로그램을 결정하려면 수치적 방법이 필요합니다. 현재 CGH의 계산은 일반적으로 반복 알고리즘을 사용하며, 비반복 방법은 GS 알고리즘을 발전시켜 계산 시간을 절약하도록 설계되었습니다. 개선에도 불구하고 이러한 비반복 방법은 산란 노이즈, 다운샘플링 효과 및 공액 이미지 간섭으로 인해 재구성 중에 항상 이미지 품질이 떨어지고 공간 해상도가 낮아집니다. 딥러닝 기술을 활용하여 CGH 문제에 대해 U-net 구조를 시도하여 초기에는 성공했지만, 전산 홀로그램 문제에서 U-net을 통해 얻은 홀로그램은 재구성된 이미지의 품질이 저하되는 단점이 있습니다. 전통적인 컨벌루션 신경망은 컨벌루션 필터와 비선형 활성화 함수에 의존합니다. 즉, 처리된 데이터가 선형적으로 분리 가능한 것으로 가정됩니다. 그러나 영상 코딩, 홀로그램 암호화, 주파수 분석 등의 문제는 선형적으로 분할 가능한 함수로 설명하기 어렵고, 운영 효율성을 높이기 위해 단순 컨볼루션 및 디컨볼루션은 항상 특정 영역으로 제한됩니다. U-net이 글로벌 정보를 활용하고 다시 작성할 수 없다는 것은 광학 이미지 처리가 매우 약하다는 것을 의미합니다.

WiMi는 기존 CGH 방법의 긴 계산 주기와 열악한 품질 문제를 해결하는 것을 목표로 하는 딥 러닝 기반 CGH 이미징 방법인 효율적인 컴퓨터 생성 홀로그래피(ECGH) 기술을 개발했습니다. 이 방법은 전산 홀로그램 이미징을 위해 MLCNN(혼합 선형 컨벌루션 신경망)을 사용하고 네트워크에 완전히 연결된 레이어를 도입하여 정보 마이닝 및 정보 교환을 향상시킵니다.

네트워크는 라인 포크 레이어가 있는 MLCNN 구조, 다운 샘플링을 위한 "DownSample" 구조, 업 샘플링을 위한 "UpSample" 구조를 사용합니다. 이 기술은 신경망 모델을 사용하여 입력 대상 광학장을 계산하고 위상 값을 계산하여 광학 실험 결과를 시뮬레이션합니다. 목표 광학장을 손실 함수를 사용하여 시뮬레이션 결과와 비교하고 손실 값의 기울기를 계산한 후 역전파하여 네트워크 매개변수를 업데이트합니다.

WiMi의 ECGH 방법은 고품질 홀로그램 이미징을 생성하는 데 필요한 순상 이미지를 신속하게 얻을 수 있습니다. WiMi의 ECGH 기술은 기존 딥러닝 기반 CGH 방법과 비교하여 네트워크 훈련에 필요한 매개변수 수를 약 60% 줄여 네트워크의 효율성과 안정성을 향상시킬 수 있습니다. 또한 ECGH 기술의 네트워크 구조는 매우 다양하며 다양한 이미지 재구성 문제를 해결하는 데 사용될 수 있어 실용성과 응용 가능성이 높습니다.

WiMi의 ECGH 이미지는 홀로그램 생성을 더 빠르게 계산할 수 있는 비반복 딥 러닝 모델 MLCNN을 사용합니다. ECGH 방법을 성공적으로 적용함으로써 고품질의 안정적인 전산 홀로그램 이미지를 얻을 수 있습니다. MLCNN 구조의 주요 특징은 지역 간 데이터 교환을 계산하는 기능으로, 이는 글로벌 정보 조작이 필요한 복잡한 광학 기능에 적합합니다. WiMi의 ECGH 기술에 MLCNN 모델을 적용하면 광학 기능의 복잡성을 효과적으로 처리할 수 있습니다. 이 모델은 고품질 홀로그램 이미지를 생성하기 위해 다양하고 복잡한 광학 기능을 처리할 수 있습니다. 이 홀로그램 이미지는 3D 장면을 완벽하게 재현하여 관찰자에게 더욱 사실적인 시각적 경험을 제공합니다. MLCNN 모델은 U-net 네트워크 구조보다 광 도메인 적응이 더 좋습니다. 이는 광학 기능의 복잡성과 광학 도메인의 변화를 더 잘 처리할 수 있고 CGH가 3D 장면의 기능을 완벽하게 재현하고 시각적 피로를 방지할 수 있기 때문에 홀로그램 생성 및 재구성에 이점을 제공합니다.