自动阅读PDF文本生成插图ComfyUI 工作流节点

作者：Dseditor

简介

此工作流可以阅读英文PDF文件进行OCR并汇总文档内容，输出为文本，将文本转换为图像生成提示。然后使用SD3生成图像并与文本结合，输出1920×1080图像（看起来像演示文稿）。
摘要使用 Ollama，OCR功能使用 Florence2。此工作流可以从 arXiv 读取 PDF，对其进行总结，并生成伴随摘要的插图。然而，此工作流并不适合用作学术论文，因为此类论文中的图像（如另一张图像中的 SD3 论文）是由 SD3 随机生成的。但如果是小说或故事类的文本，相信效果会不错。

工作流节点截图

附件文件一览

模型
Checkpoints
sd3_medium_incl_clips_t5xxlfp8.safetensors👉

内置节点
DownloadAndLoadFlorence2Model
EmptySD3LatentImage
Fast Groups Bypasser (rgthree)
Florence2Run
ImageConcatMulti
LayerUtility: SD3NegativeConditioning
PDFToImage

自定义节点
Comfyroll Studio
– CR Text Concatenate
ComfyUI
– CLIPTextEncode
– CheckpointLoaderSimple
– PreviewImage
– SaveImage
ComfyUI Impact Pack
– ImpactSwitch
ComfyUI Layer Style
– LayerUtility: ColorImage V2
– LayerUtility: SimpleTextImage
– LayerStyle: DropShadow
ComfyUI Ollama
– OllamaGenerate
ComfyUI-Gemini
– Gemini_API_Zho
Efficiency Nodes for ComfyUI Version 2.0+
– KSampler (Efficient)
Save Image with Generation Metadata
– String Literal
WAS Node Suite
– Text List to Text
– Text List

资源下载

下载价格免费

此资源购买后60天内可下载。限时福利：新注册用户可获得5积分奖励～

常见问题

工作流报错？

工作流报错包括缺少节点、模型等。缺少模型可按工作流内模型名称进行站内搜索。

工作流缺少节点？

1.不同的ComfyUI工作流会涉及不同的扩展节点，最快解决方法是下载扩展管理器ComfyUI-Manager（https://github.com/ltdrdata/ComfyUI-Manager）来自动补全缺失节点。
2.某些节点可能过于老旧或被弃用，建议把同类节点升级或尽量使用新日期的工作流节点。

工作流模型和推荐模型不一样？

有些工作流使用的模型与文章推荐的模型会有所不同，这是因为模型版本一直在更新，我们尽可能选择不改变效果的范围内给您推荐较新版本的模型，所以会导致有些模型的名称与工作流内的模型名称不相同，但不影响使用，在使用的过程中可以留意一下就好。

模型下载后要怎么安装？

一般模型分为大模型CheckPoint和风格模型LoRA、VAE或CLIP等类型，多数情况下，它们都应分别放在ComfyUImodels目录下对应类型的文件夹内即可，而有些基础模型则要放在其扩展名称的models文件夹内。基础模型种类繁多且，他们的安装方法一般在其官方链接中有详细说明。

模型下载后可以修改文件名吗？

重命名不会影响该模型的功能，但会导致工作流节点找不到原来的模型文件。虽然可以手动选择，但不建议这么做！因为模型的种类和版本成千上万，名称相似的也数量不少，一旦随意更改模型原名称，很可能会造成众多模型文件过于混乱对不上号的可能。

/workflow-pdftoslides.html，转载请注明出处。
由于本网站资源是搜集整理而成，版权均归原作者所有。网站内所有资源仅供学习交流之用，请勿用作商业用途，并请于下载后24小时内删除，如果喜欢，请支持正版，谢谢。