본문 바로가기

GAN

Disentangled Representation Image-to-Image Translation (DRIT) 1 Introduction 두 개의 visual domains 사이의 mapping을 학습하기 위해 두 가지 어려움 점 존재. aligned training image pairs 수집이 어려움. many such mappings are inherently multimodal single input에 대해 다수의 output 존재 가능성. multi modal 은 아래 그림과 같이 age로 변환된다고 하더라도 20대 input이 40대나 50대, 60대의 다양한 output으로 변환하는 것을 의미. 이를 해결하기 위해 stargan과 같은 방법론 제안되었지만, 주어진 input image에 대해 single output만 생성되는 한계 generator에 noise vectors를 input으로 추가하는 .. 더보기
COCO-FUNIT:Few-Shot Unsupervised Image Translation witha Content Conditioned Style Encoder coco-funit은 funit을 발전시킨 형태 FUNIT REVISIT 기존FUNIT을 먼저 살펴보면 content encoder Ec, style encoder Es, image decoder F 로 구성됨. Ec는 content image xc을 input 으로 받아서 content embedding code zc 을 output으로 Es는 style image xs를 input으로 받아서 style embedding code zs 를 output으로 image decoder F는 zc와 zs를 이용해서 이미지 생성. 이 때 zs는 F의 AdaIN의 mean 과 scale parameters를 계산하는데 사용됨. AdaIN design 은 domain-specific information 이 act.. 더보기
Scalable Fine-grained Generated ImageClassification Based on Deep Metric Learning fake face를 구분 가능한 방법 제안. 새로운 형태의 이미지가 생겨도 대응 가능. Train stage에서 다양한 형태의 이미지를 이용해 학습 Fine-tunning stage에서 triplet loss를 이용해서 new type of few images를 이용해 학습. Training Center loss : to minimize the intra-class distance The role of cross entropy loss is to maximize the distance between classes and thus improve the separability between classes Fine-tuning 새로운 형태의 생성이미지에 대응하기 위해 fine tunning 수행. triple.. 더보기