ChatGPT 图像 2.0 官方指南整理
基于 OpenAI 2026年4月21日发布页|日新美術编辑部
ChatGPT 图像 2.0是 OpenAI 面向 ChatGPT、Codex 与 API 推出的新一代图像生成能力。官方页面围绕一个核心变化展开:图像不再只是装饰性结果,而可以承担解释、设计、教学、研究、广告、分镜和产品原型等更完整的视觉任务。
本指南依据 OpenAI 中文官方页进行完整信息点整理:模型定位、精度提升、多语言文本、风格写实、纵横比、现实世界知识、Thinking Mode、Codex、API、限制、安全与开放范围。
官方定位与发布信息
ChatGPT 图像 2.0|开启图像生成的新纪元

Create a bold editorial poster introducing ChatGPT Images 2.0. Use a modern magazine layout, large readable typography, blocks of explanatory text, and geometric accents in red, black, blue, yellow, and warm off-white. Make the image feel like an official product launch poster.
从“单纯渲染”到“视觉系统”
官方正文先把图像定义为一种语言:好的图像可以筛选素材、组织结构、解释机制、营造情绪、测试创意,也可以论证一个观点。ChatGPT 图像 2.0 的定位,是把这种视觉表达能力从“生成一张图”推进到“完成复杂视觉任务”。
OpenAI 对这次更新的说明集中在几条主线:更强的文字渲染、多语言支持、视觉推理、指令遵循、对象关系控制、宽高比选择、现实世界知识以及 Thinking Mode。这使模型更适合产出可直接讨论、修改、教学、展示和继续构建的视觉结果。
对学习美术、设计与影像的同学来说,它不应只被当成“出图按钮”,更适合作为视觉推敲、资料转译、多版本方向探索和作品集表达检查的工具。越是复杂的项目,越要把目标、结构、文字、尺寸和限制写清楚。
日新美術学院 编辑部建议
先把 Images 2.0 理解为“视觉项目助手”
如果只是输入一句很短的审美描述,它当然可以生成漂亮图片;但它真正适合发挥的地方,是把目标、尺寸、文字内容、对象关系、参考风格、使用场景一次性讲清楚,让模型完成更有组织的视觉方案。
| 官方正文顺序 | 本指南对应章节 | 整理重点 |
|---|---|---|
| 发布定位Opening | 01 官方定位 | 图像作为语言;模型从单图生成走向复杂视觉任务。 |
| 能力升级Precision / Language / Style | 02-04 能力章节 | 指令跟随、细节控制、多语言文本、风格与写实度。 |
| 输出方式Aspect ratios | 05 规格比例 | 3:1 到 1:3 的比例范围,适合横幅、幻灯片、海报、手机屏幕、书签和社媒素材。 |
| 推理与平台Thinking / Codex / API | 06-07 工作流 | 搜索、资料转译、多图生成、Codex 内创作、API 集成。 |
| 限制与安全Limits / Availability | 08 注意事项 | 物理世界建模、标注图表、2K 以上测试、开放范围与安全策略。 |
更高精度与控制力
小字、图标、UI、密集构图与细节约束

Design a modernist poster titled "Greater Precision and Control". Use strong typography, clean geometric shapes, and a restrained black, red, and cream palette. The layout should explain that the image model follows detailed instructions, preserves small details, and handles dense visual compositions.

Create a realistic macOS screenshot where the front browser window is ChatGPT. The user asks for a simple drawing, and ChatGPT replies with ASCII art. Keep the desktop messy in the background, with multiple open windows such as a terminal, notes, files, and productivity apps.
官方重点:忠实执行复杂视觉要求
官方正文强调,图像 2.0 在清晰度和忠实度上明显加强,能够处理更复杂的图像构想,并把用户的视觉意图转成更接近可用成品的结果。这里的“精度”不仅指画质,也指对象位置、对象关系、文字层级和细节保留。
官方特别提到的难点包括:微小文字、图标系统、UI 元素、密集构图、细微风格约束,以及 API 中最高可达 2K 的输出。换句话说,它更适合那些需要“按要求完成”的设计任务,而不是只追求模糊氛围。
精确指令
适合要求明确元素、对象位置、文字层级、图标细节与版面约束的任务。
密集构图
适合信息图、说明页、展板、海报、UI mockup 等需要同时承载信息与审美的画面。
风格一致
在摄影、手绘、漫画、广告、品牌物料中,更容易维持质感、光线、材质与视觉语言。
可用成品
从“接近想象”更进一步,转向能直接用于讨论、修改、展示或作为制作基底的视觉稿。
- 对象:画面中有什么主体、配角、道具、文字、图标。
- 关系:对象之间的位置、比例、视线、动作与层级。
- 输出:海报、分镜、样机、UI、论文图解、社媒图、品牌物料等。
- 限制:必须保留的文字、不能改变的颜色、需要避开的风格。
- 用途:作品集讨论、课堂说明、广告投放、内部提案或正式发布前草案。

Make a dense mixed-media collage poster about creating everything at once. Combine art, science, history, maps, architecture, anatomy sketches, planets, symbols, crystals, and global culture references into one energetic but well-organized visual mosaic.

Create an editorial magazine spread about North American wolf packs. Include wildlife photography, a strong title, myth-versus-fact callouts, a map, statistics, and small explanatory illustrations. The page should feel like a polished educational science feature.

Generate a realistic pencil-written school notebook page about the history of baseball in Toronto. Use lined paper, natural handwriting, small corrections, and class-note organization. Mention early local teams and the origin of the Blue Jays in a student-note style.

Generate an extreme close-up macro photograph of uncooked white rice grains piled on textured burlap. Emphasize thousands of tiny repeated grains, subtle shadows, natural variation, and tactile realism.
文字与多语言能力
从装饰性字符到可阅读视觉文本

Design an editorial poster titled "Stronger Across Languages". Combine bold typography, multilingual text samples, geometric shapes, and explanatory copy about improved rendering across global writing systems. Keep the composition clean, readable, and graphic.
文本不再只是“像字”,而要成为设计的一部分
过去的图像生成工具常见问题是文字看起来像装饰纹理,真正阅读时会出现拼写、字形、断行或排版错误。Images 2.0 的一个关键改进,就是让图像中的文本更接近真实设计稿里的可读文字。
官方正文特别说明,上一代图像生成在英语与拉丁语系文字上相对稳定,但面对复杂、密集、非拉丁文字时仍有不足。图像 2.0 的改进重点之一,就是让中文、日语、韩语、印地语、孟加拉语等文字在视觉中更清楚、更连贯。
在日新美术的作品集准备语境里,这一点非常重要:展板标题、日英双语标签、品牌海报、漫画台词、研究图表和说明标注,都依赖文字与视觉结构的同步设计。建议在提示词里明确写出必须出现的文字,并说明文字层级、语言、字体气质和所在位置。
中文 / 日文混排 设计标题
- 指定中文主标题和日文副标题。
- 说明标题位于画面上方、中轴或左侧栏。
- 要求文字清晰、拼写准确、避免装饰性乱码。
- 给出字体气质:现代、杂志感、手写、复古等。
漫画 / 信息图 密集文本
- 把每段文字拆成短句。
- 指定每个气泡、标签或图例的文字内容。
- 让模型先生成版面草案,再要求修正文字。
- 正式使用前仍需人工校对。

Create a color Japanese shonen adventure manga page. The main character discovers a magical quill called the Quill of GPT Image. Make the scene dramatic and cinematic, with Japanese text throughout, strong panel flow, fantasy effects, and the feeling of a photographed physical manga page. Portrait format.

Create a realistic magazine-style photograph inside an Indian bookstore. Show made-up art books published by OpenAI, with clearly readable covers in Hindi, Bengali, Marathi, Telugu, Tamil, Urdu, Gujarati, Kannada, and Odia. The purpose is to celebrate India's linguistic diversity. Portrait format.

Create a comic-style page showing an OpenAI researcher demonstrating multilingual text rendering. Include translated city posters, a smartphone chat, Chinese text, and celebration messages in several languages. Use refined panels and a lively explanatory tone.

Create a premium hospitality campaign for a Korean hanok stay. Use elegant Korean typography, serene lifestyle photography, refined branding, and a calm multi-panel brochure layout. The result should feel like a market-ready travel advertisement.

Create an editorial typography poster celebrating global scripts. Mix Japanese, Arabic, Korean, Devanagari, Cyrillic, Bengali, Greek, Chinese, and Latin letterforms in a modern graphic composition. Treat the text as both language and visual form.
风格表现力与写实度
摄影、电影、漫画、像素艺术与媒介质感

Design a minimalist magazine poster about stylistic sophistication and realism. Use bold typography and red, blue, black, and cream geometry. Show that the model can render photography, illustration, comics, pixel art, and other visual styles with fidelity.
不只是“套风格”,而是理解媒介特征
官方正文指出,图像 2.0 在多种视觉风格上的忠实度都有提升。它更能捕捉摄影里的关键特征,包括让画面更真实的细微瑕疵;也能更好地区分电影剧照、像素艺术、漫画、复古海报、时尚画册等媒介语言。
这类提升对创作非常实际:游戏原型、故事板、广告创意、角色设定、画册排版、视觉研究,都需要稳定的风格系统。模型如果只给“像某种风格”的表面效果,后续就很难延展;而图像 2.0 更适合做一组具有一致视觉语言的资产。

Create a candid cinematic portrait at a coastal highway overlook on a cloudy day. A person in a brown jacket looks back toward the camera, with cliffs, ocean, mist, and a parked car in the background. Make it feel like a real unplanned photograph.

Create a night flash photograph of two friends posing together on a city street. One smiles at the camera while the other shouts playfully. Use direct flash, deep shadows, early-2000s compact-camera energy, and a casual party snapshot feeling.

Create a surreal fashion portrait with deadpan photography. A model in floral styling sits calmly, holding a poodle, with an unexpected dark bird perched above. Make the art direction strange, elegant, controlled, and dreamlike.

Create a high-fashion editorial book spread with two sculptural designer gowns, one soft gray and one black. Use dramatic poses, minimal page design, luxury magazine photography, and carefully controlled studio lighting.

Create a gritty cinematic portrait shot on medium-format color film. Use shallow depth of field, misty open-road atmosphere, imperfect realism, natural posture, and a distinctive American roadside mood.

Create a photorealistic university lecture hall scene from 2015. A professor presents slides about GPT image generation, and the slide itself recursively shows the same lecture scene. Keep the room, projection, students, and slide text believable.

Create a casual iPhone-style photo at an outdoor cafe in late afternoon. Show unusual guests sitting naturally at the table, half-finished drinks, uneven sunlight, relaxed posture, imperfect framing, and everyday snapshot realism.

Create a candid disposable-camera snapshot from an early-2000s American high school computer lab. Include beige CRT monitors, old desktop towers, messy cables, Windows-era screens, school supplies, and the flash-photo feeling of a found memory.

Create a 35mm photograph of a vintage street-photography book. Show printed pages filled with 1970s New York candid street images, paper texture, book shadows, and the documentary feel of analog urban photography.

Create a black-and-white manga page about loneliness and wanting to be seen. Use cinematic city scenes, close-up emotional panels, late-night atmosphere, and introspective narration. Keep the page expressive, readable, and sequential.

Create a retro French New Wave poster for GPT Images 2.0. Use torn paper collage, bold typography, cream, red, blue, and black colors, cinematic portraits, street photography energy, and a strong graphic point of view.

Create a theatrical poster with a mid-century Czech graphic design spirit. Use bold symbolic shapes, collage-like composition, restrained colors, print texture, expressive typography, and a striking art-house mood.

Create a vintage comic page turning a Miami museum visit into a narrative sequence. Include consistent characters, destination branding, readable text, retro print texture, and multiple panels that feel like a travel story.

Create a page of a modern indie comic. Use soft urban twilight, quiet character dialogue, expressive but understated faces, cinematic panel pacing, and a reflective emotional tone.

Create an anime character sheet for a cheerful support-fighter heroine named Adele. Include her glowing chain weapon, role, abilities, expressions, full-body poses from multiple angles, personality notes, and small lifestyle details in a scrapbook layout.

Create a studio artifact page built from food-based calligraphy materials. Use unusual edible textures as the writing medium, arrange the composition like a photographed design experiment, and make the material choices feel intentional.
日新美術学院 编辑部建议
作品集里应把 AI 当作风格研究工具
不要只让模型模仿名词化的“某某风”。更好的做法是让它拆解媒介规律:构图、镜头、材质、印刷、线条、字重、留白、叙事节奏。这样生成结果才能服务于你的个人创作,而不是反过来吞掉你的判断。
规格、比例与多图输出
从单张图到一组可交付资产

Design a Bauhaus-inspired poster about flexible aspect ratios. Use bold typography, clean geometry, and visual examples that communicate outputs ranging from wide banners to vertical phone screens.

Create a four-page American retro comic about two close friends taking a trip through southern France. Keep the characters consistent across pages, use warm travel scenery, readable panel text, and vintage print texture.
官方重点:比例成为提示词的一部分
官方正文明确提到,ChatGPT 图像 2.0 支持从超宽比例到超竖比例的输出。它可以服务于横幅、演示文稿、海报、手机屏幕、书签和社交媒体等不同格式,不需要先生成一张图再强行裁切。
使用时可以直接在提示词里写清楚目标比例,也可以使用界面预设重新生成。对于设计学习来说,这一点很关键:同一概念在横图、竖图、方图和长条书签中的视觉重心完全不同。
海报
适合展览告知、课程项目视觉、品牌活动主视觉。
演示页
适合课堂发表、作品集讲解、研究计划书图解。
社媒图
适合方图、竖图、横幅、活动宣传多尺寸适配。
分镜页
适合角色设定、动作分解、故事节奏和画面调性探索。
展板
适合概念、流程、调研、结果和视觉系统的综合呈现。

Create a wide manga-style motion breakdown of a basketball dunk. Show the athlete dribbling, gathering, jumping, hanging in the air, and finishing the dunk. Make it useful as an animation keyframe study.

Create an ultra-wide daytime panorama of a busy Thai urban street. Include multi-lane traffic, taxis, buses, motorcycles, high-rise buildings, shopping centers, bright sky, and Thai signage. Emphasize scale and street density.

Create an ultra-wide comic panorama of a road trip through Provence. Use sequential vignettes across the width, warm landscape colors, playful travel moments, and enough visual continuity to read like a long horizontal story.

Create a print-ready Art Deco bookmark for Tangerine Books. Use ornate gold geometric borders, a sunrise motif, an open book with the Toronto skyline rising from the pages, plus bleed marks, crop lines, and safe margins.

Create a traditional Chinese shanshui landscape painting in an ultra-wide 3:1 format. Use misty mountains, layered distance, ink-wash texture, sparse architecture, and a calm horizontal scroll composition.

Redraw a group portrait as very simple surreal Japanese sticker-style caricatures. Use long thin necks, small deadpan faces, minimal black outlines, flat pale colors, white background, and an awkward playful group arrangement.

Create a whimsical storybook illustration about patience and progress. A winding path passes small milestones and magical characters, repeatedly showing the phrase "not yet", until it reaches a cozy house with the message "you made it".
制作重点
不要只说“生成海报”,要说清楚最终投放位置
同样是海报,A1 展板、Instagram 竖图、网页首屏横幅和手机锁屏的构图逻辑完全不同。提示词里直接写“用于哪里、什么比例、是否需要裁切安全边距”,会比后期硬裁切更稳定。
现实知识与 Thinking Mode
让模型先理解资料,再生成视觉结果

Create a modernist poster about enhanced real-world intelligence. Use bold typography and geometric forms to explain current knowledge, context awareness, and the ability to transform information into clean visual outputs.

Create a clean Bauhaus-style poster presenting the model as a visual thought partner. Show how it can research, reason, transform source material, and turn rough inputs into coordinated visual assets.
适合交给 Thinking Mode 的任务
官方正文将“现实世界智能”和“Thinking Mode”分成两个层次:前者让模型更理解真实世界语境,后者让模型在复杂任务前先搜索、推理、整理材料,再生成视觉结果。官方页标注的知识截止时间为 2025年12月。
当任务涉及真实资料、当前信息、复杂结构或多张连续输出时,Thinking Mode 的价值会更明显。它可以先整理资料、推敲结构,再把信息转成视觉表达,而不是直接“凭感觉画一张”。
官方还强调,具备思考能力后,模型可以一次生成多张不同图像,并在角色、物体、特征和项目步骤上保持连续。这让它能承担系列漫画、室内改造方案、一组海报概念、不同语言与比例的社媒资产等原本很繁琐的流程。

Turn the GPT-1 paper into a polished conference-style academic poster. Organize the content into motivation, method, results, and impact. Use clean data visualization, clear headings, and publication-ready layout.

Search for current OpenAI merchandise and create a professional product-grid poster. Title it "Thinking Mode Searches" and include a subtitle explaining that thinking mode can browse for relevant references. Use a clean 4:5 portrait layout.

Create a 35mm film photograph of a classroom blackboard. On the board, draw a visual proof that the sum of consecutive odd numbers forms a square. Add the title "Thinking Mode On" before the proof. Use a 4:5 portrait format.

Create a polished launch advertisement for a Brooklyn Heights matcha shop named Kizuki. Feature an iced strawberry matcha in sunlight, Japanese minimalist streetwear aesthetics, clean branding, and a social-ready layout.

Create a square social post for a Brooklyn Heights matcha shop named Kizuki. Use sunlit strawberry matcha product photography, Japanese minimalist streetwear energy, refined typography, and a crisp opening-announcement layout.

Create a horizontal social media banner for the Kizuki matcha shop opening in Brooklyn Heights. Keep the same strawberry matcha hero product, bright sunlight, modern Japanese minimalism, and premium streetwear-inspired brand tone.

Create a vertical story-format advertisement for Kizuki, a Brooklyn Heights matcha shop. Emphasize the iced strawberry matcha, opening announcement, Japanese minimalist styling, warm sunlight, and spacious mobile-first typography.

Continue the same four-page American retro comic series about two close friends traveling through southern France. Preserve the characters, colors, print texture, panel rhythm, and lighthearted road-trip tone.

Continue the same four-page American retro comic series. Keep the character designs stable, show a new moment from the southern France trip, and maintain readable captions, vintage color, and sequential page flow.

Finish the four-page American retro comic series with a satisfying travel-story conclusion. Keep the same characters, print texture, panel style, and warm southern France atmosphere.

Create a beautiful educational infographic explaining Cantor's diagonal argument. Show how assuming all real numbers can be listed lets us construct a new number that differs along the diagonal. Use clear steps and readable math labels.

Create a wheatpaste-style poster presenting six major design trends for 2025. Give each trend an equal panel, use bold urban poster texture, concise labels, and visual symbols that make the trend differences easy to compare.

Create a personal color analysis board for a Deep Autumn palette. Show warm neutral undertones, medium contrast, rich earthy colors, flattering swatches, and less suitable cool pastels, neons, and pure white.
Codex 与 API 工作流
从设计任务到产品功能集成
官方重点:图像创作进入统一工作空间
官方正文提到,Codex 中的图像功能可以把视觉创作并入开发、演示、设计和发布流程。对产品、营销、销售、学习与发展等工作来说,这意味着图像不再只是最后补一张配图,而可以参与 UI 方向探索、概念稿、原型和网站体验迭代。
官方同时说明,开发者和企业可以通过 API 集成 gpt-image-2,把高质量图像生成与编辑接入自己的产品。适合的方向包括本地化广告、信息图、解说内容、教育素材、设计工具、创意平台和网页创作产品。
| 入口 | 官方整理重点 | 适合任务 | 使用建议 |
|---|---|---|---|
| ChatGPT对话式创作 | 通过多轮提示词生成、修改和检查图像。 | 海报、社媒图、分镜、信息图、作品集草案。 | 先说明目标和结构,再逐步要求修正局部。 |
| Codex开发工作区 | 在同一工作空间内创建设计方向、原型与网站视觉。 | UI 方案、概念稿、演示页、产品落地页。 | 把图像生成和代码实现放在同一轮迭代里。 |
| APIgpt-image-2 | 把图像生成和编辑能力接入产品。 | 本地化广告、教育图、设计工具、创意自动化。 | 提前设计审核、尺寸、文本校对和版权流程。 |
API 客户案例整理
官方页把 API 用例放在“真实产品工作流”里理解
OpenAI 官方页展示了 Canva、Figma、Adobe、OpenArt 等客户案例。共同点不是单纯“生成漂亮图”,而是把 gpt-image-2 放进真实的设计、编辑、创意自动化和视频制作链路中,让模型参与理解 brief、组织版式、生成可编辑素材或规划镜头。

Create a premium social advertisement for a new glow lip balm by a fashion celebrity. Target ages 14 to 30, use a stylish model, clean luxury aesthetics, trendy details, polished product photography, and campaign elements that feel shareable.

Create a text-rich product design visual suitable for a collaborative design tool. Use clean interface-like layout, readable copy blocks, modern typography, and a composition that can be edited or iterated by a design team.

Create a photorealistic scene that a product design team could use as a visual direction study. Keep the image polished, editable in concept, and clear enough to compare with alternate design routes.

Create a structured visual content sample for a creative AI studio. Emphasize photorealism, prompt precision, professional polish, and a layout that gives creators room to explore and refine the result.

Create a cinematic storyboard from a simple production brief. Design characters, environments, shot types, camera movement notes, and sequence structure so the result can guide a studio-quality video workflow.
限制、安全与开放范围
哪些地方仍需人工审核
仍可能挑战模型 需谨慎
- 完整、连贯地建模复杂物理过程,例如折纸步骤或魔方类谜题。
- 在隐藏、倾斜或反向表面上精确呈现细节。
- 处理极度密集或重复的视觉特征,例如大量细碎颗粒。
- 需要精确箭头、零件标注和专业图表的场景。
人工审核重点 必须
- 标签、图表、箭头、部件说明和数据准确性。
- 多语言文字、专有名词、日期、品牌与法律信息。
- API 中超过 2K 的输出仍处测试阶段,可能出现不一致。
- 作品集、比赛、客户项目必须确认 AI 使用规则。



安全说明
安全策略是端到端的,不是只靠最后拦截
官方正文提到,OpenAI 会以端到端方式推进图像安全:减少有害输出、部署防护机制,并随模型能力和风险变化持续更新。对使用者而言,最务实的做法是把“人工审核”写进工作流,而不是把 AI 输出直接视为最终真相。
提示词制作流程
从目标设定到可修改视觉稿
官方 Prompt 摘录说明
这里整理官方样张 prompt 的完整结构,不逐字复刻长段原文
OpenAI 官方页的样张下方包含多组 prompt。受版权限制,本指南不整段转载官方英文 prompt;以下按官方样张逐项还原其任务目标、关键约束、比例参数和可学习的提示词结构。少量标题词与短语保留为识别用。
| 官方样张 | Prompt 目标 | 关键约束 | 可学习写法 |
|---|---|---|---|
| macOS 桌面截图ASCII dog | 生成一张浏览器里的 ChatGPT 截图:用户要求画一只狗,ChatGPT 用 ASCII 图回应。 | 前景是 ChatGPT,背景是凌乱的 macOS 桌面和多个窗口,例如终端。 | 把界面层级、前景窗口、背景环境都写清楚。 |
| 日语少年漫画页Quill of GPT Image | 生成彩色日式少年冒险漫画页,主角发现一支带有强大力量的魔法羽毛笔。 | 竖版 1440×2560;笔上有 OpenAI 标志;全篇日语;先思考故事与分镜;画面像实体纸张照片。 | 同时指定故事事件、道具命名、语言、比例、物理媒介感。 |
| 印度书店摄影Multilingual books | 生成印度书店的专业写实摄影杂志页,展示不同印度语言的艺术书封面。 | 语言包含 Hindi、Bengali、Marathi、Telugu、Tamil、Urdu、Gujarati、Kannada、Odia;书名与艺术相关;出版社为 OpenAI;文字清晰;竖版 1440×2560。 | 多语言任务要列出具体语言清单、文本可读性、场景真实性和用途。 |
| OpenAI 周边海报Thinking Mode Searches | 让模型搜索 OpenAI Supply Co 的现有周边,并生成专业产品网格海报。 | 海报标题为 Thinking Mode Searches;副标题说明 Thinking Mode 可联网寻找参考;下方加入 prompt 说明;比例为 4:5 竖图。 | 把搜索动作、信息来源、标题、副标题、图注和比例一起写入 prompt。 |
| 黑板数学证明Thinking Mode On | 生成 35mm 胶片摄影感的课堂黑板,上面呈现连续奇数之和构成平方数的视觉证明。 | 黑板上先出现 Thinking Mode On 标题;证明内容在其后;比例为 4:5 竖图。 | 教学图像要指定摄影媒介、场景、标题、证明内容和比例。 |
| 宽幅动作分解Dunk sequence | 用漫画风格逐帧分解篮球扣篮动作,从运球、起跳到扣篮完成。 | 连续动作要清楚,适合宽幅信息图或动画关键帧研究。 | 动作任务要写出时间顺序、关键姿势、画面阅读方向。 |
| Art Deco 书签Print-ready bookmark | 为 Tangerine Books 生成装饰艺术风格书签,以多伦多天际线和打开的书页为主题。 | 包含金色几何框、日出图案、出血位、裁切线和安全边距。 | 印刷品 prompt 要写入出血、裁切、安全边距、品牌和装饰风格。 |
| 官方样张(续) | Prompt 目标 | 关键约束 | 可学习写法 |
|---|---|---|---|
| “同时创造一切”拼贴Create Everything at Once | 把艺术、科学、历史、设计、全球文化元素组织成一张大型视觉拼贴。 | 包含行星、解剖草图、地图、建筑、符号、晶体和混合媒体图像等大量元素。 | 复杂拼贴要列出元素清单、主题关系、视觉密度和整体调性。 |
| 北美狼群杂志跨页Wolf magazine | 生成科普杂志式跨页,用摄影、标题、事实辨析、地图和统计解释狼群行为。 | 需要同时包含野生动物照片、醒目标题、地图、数据、插图和“传闻 / 事实”式标注。 | 信息页要写清栏目类型、图文比例、数据模块和阅读路径。 |
| 多伦多棒球史笔记Handwritten notes | 生成铅笔手写的学校笔记页面,主题是多伦多棒球史和蓝鸟队起源。 | 横线纸、铅笔书写、学生笔记质感,文字要看起来像自然手写。 | 手写类 prompt 要写纸张、笔触、书写者身份、主题和真实瑕疵。 |
| 韩屋住宿广告Hanok campaign | 生成韩国 hanok stay 的高端旅游 / 酒店广告物料。 | 要有 lifestyle 摄影、韩文排版、品牌感、安静高级的旅游广告氛围。 | 商业广告 prompt 要写行业、场景、目标客群、语言和品牌气质。 |
| 夜间闪光灯抓拍Point-and-shoot flash | 生成两位朋友在夜晚场馆外的写实抓拍肖像。 | 近距离主体、直接闪光、清晰前景、深阴影、早 2000 年代小型相机质感。 | 摄影 prompt 要写相机类型、光源、距离、瑕疵、时代感和情绪。 |
| 高端时尚画册High fashion spread | 生成杂志画册页,两位模特穿雕塑感礼服,以高级摄影方式呈现。 | 极简排版、戏剧化姿势、服装材质、灰 / 黑礼服对照。 | 时尚类 prompt 要写造型、材质、姿势、摄影语言和版面类型。 |
| 独立漫画屋顶对话Indie comic | 生成现代独立漫画页,两个年轻人在黄昏屋顶谈论迷茫与羁绊。 | 柔和色调、都市黄昏、角色表情、电影感分镜和深思性对白。 | 叙事漫画 prompt 要写人物关系、场景时间、对白气质和分镜节奏。 |
| 动漫角色设定图Adele character sheet | 生成名为 Adele 的动漫角色设定页,展示辅助战斗型女英雄。 | 包含角色定位、武器、能力、表情、多角度站姿、性格备注和生活细节。 | 角色设定 prompt 要写姓名、职业定位、武器、表情、姿势和补充备注。 |
| GPT-1 学术海报Academic poster | 把 GPT-1 论文重新组织成会议风格信息图。 | 需要包含动机、方法、结果和影响等章节,并保持现代数据可视化清晰度。 | 论文转视觉要写原始资料、章节结构、图表风格和受众。 |
| 2025 设计趋势图Trend infographic | 生成 2025 年设计趋势信息图,展示多个趋势关键词与视觉样式。 | 要包含趋势名称、解释、视觉象征、品牌推广和数字美学的关系。 | 趋势类 prompt 要写年份、趋势清单、解释层级和视觉隐喻。 |
| Deep Autumn 色彩分析Color analysis board | 生成个人色彩分析板,判断为 Deep Autumn 并展示合适与不合适色系。 | 暖中性底色、中等对比、浓郁土色系,以及与冷粉彩、霓虹、纯白的对比。 | 分析板 prompt 要写判断结论、色票、对比组、说明文字和版式层级。 |
| 经典模式分组 | 官方案例标签 | 本指南补充重点 |
|---|---|---|
| 精度与控制力Precision | UI 截图、杂志拼贴画、米堆、科学杂志页面、手写文章 | 检验小字、复杂页面、微小刻字、手写质感和多元素排版。 |
| 多语言文本Languages | 日本少年漫画、印度书店、中文漫画、韩语广告、版式海报 | 把非拉丁文字、漫画对白、广告排版和多语种字体当成设计内容处理。 |
| 照片级写实Photo realism | 自然抓拍、超现实肖像、粗粝电影感写实、讲堂照片、iPhone 外星人、时尚书籍、一次性相机、街头摄影 | 提示词需写明相机、胶片、镜头、年代、瑕疵、光源和“不是摆拍”的真实感。 |
| 风格Style | 日本青年漫画、电影海报、世纪中期粉彩漫画、现代独立漫画、角色设定图、工作室物料 | 不要只写风格名,要拆成媒介、线条、印刷、角色、版式和制作痕迹。 |
| 长宽比Aspect ratio | 篮球扣篮延时摄影、iPhone 全景、装饰艺术书签、中国传统绘画、日本漫画风格、故事书 | 同一主题按横幅、竖长图、书签、超宽群像和故事路径分别组织画面。 |
| 现实世界智能World knowledge | 对角化信息图、2025 设计趋势、颜色分析 | 适合把知识、趋势、判断和图解结构转成能被快速阅读的视觉页面。 |
| 视觉灵感伙伴Thinking Mode | 抹茶店社交媒体素材、四页漫画、GPT-1、OpenAI Supply Co、视觉证明 | 一次性输出多图、多比例、多页或需要搜索资料的成套视觉资产。 |
| API 客户案例gpt-image-2 | Canva、Figma、Adobe、OpenArt | 在产品里做文字密集视觉、照片级场景、结构化内容和视频分镜扩展。 |
编辑部版
| 目标 | 提示词重点 | 推荐追加条件 | 人工复核点 |
|---|---|---|---|
| 作品集展板Portfolio board | 研究主题、过程图、结论、视觉层级 | 指定留白、网格、标题层级和图注位置 | 文字、逻辑顺序、图像版权 |
| 漫画分镜Manga page | 角色一致性、镜头顺序、对白文本 | 指定格数、阅读方向、情绪节奏 | 对白错字、角色变形、动作连续性 |
| 品牌广告Brand visual | 产品、品牌气质、主视觉、社媒比例 | 指定材质、摄影光线、排版、色彩系统 | 商标、产品真实性、法律风险 |
| 教学信息图Infographic | 知识点、步骤、图例、图表关系 | 要求先列结构,再转成视觉布局 | 事实、公式、比例、单位 |
提示词原则
把“审美词”放在最后,把“结构信息”放在前面
好的提示词通常先讲清楚任务、内容、关系、尺寸和文字,再补充风格。只写“高级、电影感、赛博朋克、好看”容易得到漂亮但不可控的图。真正要用于作品集或商业提案时,结构比形容词更重要。
适用场景与使用建议
按设计任务选择 Images 2.0 的使用方式
| 使用场景 | 适合程度 | 推荐做法 | 注意事项 |
|---|---|---|---|
| 作品集概念探索Concept exploration | 很高 | 快速生成多方向视觉语言,再选 1-2 个方向深化。 | 不要直接把生成图当作最终原创作品提交。 |
| 展板与信息图Board / infographic | 高 | 让模型先整理结构,再生成可读版式。 | 所有事实、数字、术语必须人工校对。 |
| 广告与社媒物料Campaign assets | 高 | 同一主题输出横图、竖图、方图与不同语言版本。 | 品牌标识、人物肖像和商用授权需单独确认。 |
| 漫画与故事分镜Sequential art | 中高 | 用于前期构图、镜头节奏和角色关系探索。 | 角色一致性仍需反复修正与人工绘制完善。 |
| 最终提交物Final submission | 谨慎 | 把生成结果作为草稿、参考、辅助素材或讨论稿。 | 按学校、比赛、客户规则确认 AI 使用范围。 |
日新美術学院 进路建议
对于准备日本美大作品集的同学
① 视觉方向探索:可以用 Images 2.0 快速测试构图、色彩、摄影语言、版面结构和故事氛围,但最终作品仍要体现个人观察、手工能力和创作判断。
② 研究表达训练:适合把文字研究、访谈资料、过程图转成初步信息图,用来检查自己的逻辑是否清楚。
③ 面试与讲评准备:可以让模型生成“不同说明方式”的视觉草案,帮助你练习如何把项目讲明白。
④ 学校规则确认:不同大学、教授、比赛对 AI 辅助的接受度不同。提交前必须确认募集要項、课程要求或比赛规则。
官方原文与使用入口
本指南为日新美術学院编辑部根据 OpenAI 官方发布页进行的中文整理与设计排版。官方页面可能继续更新,最终信息请以 OpenAI 发布内容为准。
官方文字与样张版权归 OpenAI 所有;本文仅作学习、版式整理与使用方法说明,不替代官方原文。
© 日新美術学院 NISSIN ART ACADEMY
2026年度版·ChatGPT 图像 2.0 官方指南整理