Ik dacht aan een spreekbeurt en ik had daar een reeks foto’s voor nodig. Gelijk, bijna tweeduizend. (Waarom bijna tweeduizend? Omdat een proof of concept van een toepassing maar goed werkt als de proof of concept-data in de buurt van de correcte grootteorde komt — iedereen kan een toepassing flitsend doen werken als er maar tien items in zitten.)

Mijn eerste idee was: ik zet een FLUX in gang lokaal en we zien wel wat er uit komt. Natuurlijk komen daar allemaal zeer gelijkaardige dingen uit. Dus geef ik het allemaal expliciete instructies.

Dit is, in volgorde:

  • een Syriër van 35: “Candid photo, 35-year-old male Syrian man, heavyset build, tousled unkempt hair, neatly trimmed goatee, headphones around the neck, black t-shirt, seated on a low wall outside, a book or folder partially visible on the table, squinting slightly in bright light, out-of-focus green park foliage, snow on the ground visible, warm incandescent bulb overhead, yellowish tint, passport-style photo, very plain background, frontal, waist-up framing, realistic, natural skin, photojournalistic”
  • een Afghaan van 27, “Candid photo, 27-year-old male Afghan man, lean athletic build, tight natural curls, day-old stubble, kufi cap, blue oxford shirt, walking, caught mid-stride, looking at the camera, a reusable water bottle on the table beside them, pensive, lost in thought, mosque or church courtyard, softly blurred, clear sunny day, streetlight overhead, sodium orange glow, smartphone photo taken by someone else at arm’s length, subject centred, symmetrical framing, realistic, natural skin, photojournalistic”
  • een Salvadoraan van 31: “Candid photo, 31-year-old male Salvadoran man, muscular build, buzz cut, day-old stubble, reading glasses pushed up on the forehead, burgundy t-shirt, seated, leaning slightly forward, fingers loosely interlaced on the table, slight closed-mouth smile, urban alley, shallow depth of field, hot humid haze visible, cool blue-hour light just after sunset, passport-style photo, very plain background, frontal, chest-up framing, realistic, natural skin, photojournalistic”
  • een Irakees van 27: “Candid photo, 27-year-old male Iraqi man, muscular build, slightly receding hairline, pencil moustache, kufi cap, brown t-shirt, standing upright, facing the camera, guarded, reserved expression, a modest bedroom in the background, direct flash from a cheap phone camera, photo taken at an intake or registration desk, flat webcam quality, subject centred, symmetrical framing, realistic, natural skin, photojournalistic”
  • een Venezolaanse van 20: “Candid photo, 20-year-old female Venezuelan woman, lean athletic build, hair braided in two plaits, baseball cap, brim forward, cream cardigan, standing, arms loosely crossed, a book or folder partially visible on the table, neutral expression, relaxed, peeling painted wall, texture showing, bright harsh midday sun, hard shadows, photo booth, even flat lighting, centred, three-quarter body shot, realistic, natural skin, photojournalistic”

Ja, denderend it ain’t. En da’s al met veel trekken en duwen met kledingwissels en verschillende situaties en watnog.

…dus heb ik heb maar aan gpt-image-2 gegeven. Als ik niets verander aan de prompt, krijg ik deze:

Dat is al een stuk beter, maar als we toch aan de ChatGPT’s zitten, kan ik zo goed de prompt ook eerst laten herschrijven. Zo wordt wat links stond de rechtse prompt:

Candid photo, 35-year-old male Syrian man, heavyset build, tousled unkempt hair, neatly trimmed goatee, headphones around the neck, black t-shirt, seated on a low wall outside, a book or folder partially visible on the table, squinting slightly in bright light, out-of-focus green park foliage, snow on the ground visible, warm incandescent bulb overhead, yellowish tint, passport-style photo, very plain background, frontal, waist-up framing, realistic, natural skin, photojournalistic

Documentary-style photo of a 35-year-old Syrian man with a heavyset build, tousled unkempt hair, and a neatly trimmed goatee. He is wearing a black t-shirt and has headphones around his neck. The man is seated on a low wall outdoors in a park with out-of-focus green foliage and snow visible on the ground. He is squinting slightly against bright warm yellowish light from an overhead incandescent bulb in the evening. A book or folder is partially visible on the table nearby. The image is waist-up framed, frontal view, with a plain background softly blurred by mild telephoto compression and some foreground blur. The photo has natural skin texture, minor motion softness, and an unposed, candid feel typical of public-space CCTV-like stills.

Avoid: glamour, studio lighting, posed, fashion, cinematic, illustration, CGI, text, watermark, extra people, stereotypes, luxury items, poverty cues, war, weapons, political symbols, religious symbols, conventional attractiveness, anatomy errors, oversharpening

Dat geeft mij dan deze beelden:

Ayup, realistischer. Ik moet toegeven dat ik mijn meer-AI-dan-mij-ge-kunt-niet beelden een beetje ga missen, wel:

…maar het is echt geen vergelijk. De inhoud is nog hetzelfde, maar de foto’s zien er nu echt uit — vergelijk met een slider tussen de twee versies:



Reacties

Zeg uw gedacht

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie gegevens worden verwerkt.