Justin Johnson dokumentiert die Verwendung der unterschiedlichen Parameter für neural-style ausführlich auf GitHub. Im Folgenden sollen daher lediglich spezifische Einstellungen für Painting Movies diskutiert werden.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
#!/bin/bash th neural_style.lua \ -style_image style.png \ -content_image content.png -output_image output.png \ -gpu 0 \ -seed -1 \ -image_size 1280 \ -save_iter 100 \ -num_iterations 1000 \ -content_weight 50 \ -style_weight 1000 \ -style_scale 1 \ -original_colors 0 \ -init image \ -backend cudnn \ -cudnn_autotune \ -optimizer cudnn \ |
Vorlage (Kandinskys Black and Violett von 1923) und Zielbild (Quelle: PD/Rada)
Die GPU-basierte Renderzeit für ein Filmbild mit einer Auflösung von 1280 x 720 Pixel und 1000 Iterationen beträgt unter Verwendung des VGG-19-Modells von Leon Gatys etwa siebeneinhalb Minuten. Die Rechenzeit für ein Bild in der Auflösung 800 x 450 Pixel liegt bei drei Minuten.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
#!/bin/bash th neural_style.lua \ -style_image style.png \ -content_image content.png -output_image output.png \ -model_file models/nin_imagenet_conv.caffemodel \ -proto_file models/train_val.prototxt \ -content_layers relu0,relu3,relu7,relu12 \ -style_layers relu0,relu3,relu7,relu12 \ -gpu 0 \ -seed -1 \ -image_size 1280 \ -save_iter 100 \ -num_iterations 1000 \ -content_weight 50 \ -style_weight 1000 \ -style_scale 1 \ -original_colors 0 \ -init image \ -backend cudnn \ -cudnn_autotune \ -optimizer adam \ |
Berechnetes Bild mit VGG-19- und NIN-Imagenet-Modell
Bei Verwendung des NIN-Imagenet-Modells kann die Rechenzeit für ein Filmbild mit einer Auflösung von 1280 x 720 Pixel und 1000 Iterationen auf etwa 45 Sekunden verkürzt werden. Allerdings kann die Qualität der Ergebnisse je nach gewähltem Quell- und Zielbild stark schwanken.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
#!/bin/bash th neural_style.lua \ -style_image style.png \ -content_image content.png -output_image output.png \ -gpu 0 \ -seed -1 \ -image_size 1600 \ -save_iter 100 \ -num_iterations 2000 \ -content_weight 10 \ -style_weight 1000 \ -style_scale 1 \ -original_colors 1 \ -init image \ -backend cudnn \ -cudnn_autotune \ -optimizer cudnn \ |
Testbild in Originalfarben mit 2000 Iterationen
Die maximale Ausgabegröße auf der Test-Workstation liegt bei 1600 x 900 Pixel. Die Rechenzeit mit 2000 Iterationen beträgt 23 Minuten. Das Testbild wird im Beispiel mit den Originalfarben ausgegeben.
Installation von neural-style
Arbeiten mit neural-style
Stiltransfer für Videoclips
Postproduktion
Alternative Techniken