将PPT 转 Markdown 文件的开源工具:PPTX2MD

项目简介

一款 PPT 转 Markdown 文件的开源工具:PPTX2MD。

支持保留标题、列表、粗体、斜体、颜色、超链接、图片、表格以及合并单元格等 PPT 内容格式。

除此之外,还支持将图像内容专为 Markdown,效果颇为不错,有需要的不妨试下。

  保留格式

  • 标题。支持模糊匹配的自定义目录。

  • 任意深度的列表。

  • 带有粗体斜体、颜色和超链接的文本

  • 图片。它们被提取到图像文件中并插入相对路径。

  • 具有合并单元格的表格。

  • 从上到下然后从左到右的块顺序。


支持的输出

  • Markdown

  • Tiddlywiki的Wikitext

  • Madoko  

  • Quarto  



安装和用法

您需要将版本的python晚于3.10 ,并在系统上安装了PIP ,然后在终端运行:

pip install pptx2md

安装后,请使用命令pptx2md [pptx filename]PPTX文件转换为Markdown。


默认的输出文件名out.md ,并且将提取(并插入.md)的任何图片都放在/img/文件夹中。


注意:不支持较旧的.ppt文件,首先将其转换为新的.pptx版本。

Upgrade & Remove:  升级和删除:

pip install --upgrade pptx2md
pip uninstall pptx2md

自定义标题

默认情况下,此工具将所有PPTX标题分析为level 1标题标题,以获取层次结构的目录,在文件中提供您的预定标题列表并提供-t参数。


这是一个示例标题文件 (titles.txt):

Heading 1  Heading 1.1    Heading 1.1.1  Heading 1.2  Heading 1.3Heading 2  Heading 2.1  Heading 2.2    Heading 2.1.1    Heading 2.1.2  Heading 2.3Heading 3

在开始中有空格的第一行被认为是第二级标题,空间的数量是凹痕单位。在这种情况下, Heading 1.1将以## Heading 1.1输出。由于它在开始时有两个空间,因此2是标题Heading 1.1.1的单位,因此以4个空间为### Heading 1.1.1 。标题文本与模糊的匹配,无与伦比的PPTX标题将被视为最深的标题。

使用它 pptx2md [filename] -t titles.txt 。


完整的参数

  • -t [filename]尝试标题文件

  • -o [filename]输出文件的路径

  • -i [path]提取图的目录

  • --image-width [width]图片的最大宽度,在Px中。如果设置,则将图像作为HTML IMG标签。

  • --disable-image禁用图像提取

  • --disable-escaping不会试图逃脱特殊角色

  • --disable-notes音符

  • --disable-wmf保持WMF格式化图像未触及(避免在Linux下例外)

  • --disable-color禁用颜色标签

  • --enable-slides拖延幻灯片\n---\n ,如果要将PPTX幻灯片转换为Markdown幻灯片,这会有所帮助

  • --try-multi-column尝试检测多柱幻灯片(非常慢)

  • --min-block-size [size]要输出的文本块的最小字符数量

  • --wiki / --mdk如果您碰巧使用Tiddlywiki或Madoko,此参数将输出相应的标记语言

  • --qmd输出到QMD标记语言,用于四分之一动力演示

  • --page [number]仅转换指定页面

  • --keep-similar-titles保留类似的标题,并在重复的幻灯片标题中添加“(续)”


注意:安装wand,如果需要,可以更好地将WMF图像成功转换。

Screenshots  屏幕截图

Data Link Layer Design Issues  Services Provided to the Network Layer  Framing  Error Control & Flow ControlError Detection and Correction  Error Correcting Code (ECC)  Error Detecting CodeElementary Data Link ProtocolsSliding Window Protocols  One-Bit Sliding Window Protocol  Protocol Using Go Back N  Using Selective RepeatPerformance of Sliding Window ProtocolsExample Data Link Protocols  PPP

  • 顶部:标题列表文件内容。

  • 底部:生成的目录。

  • :源PPTX文件。

  • :生成的Markdown文件(由Madoko渲染)。

项目链接

https://github.com/ssine/pptx2md

扫码加入技术交流群,备注开发语言-城市-昵称

(文:GitHubStore)

欢迎分享

《将PPT 转 Markdown 文件的开源工具:PPTX2MD》有3条评论

  1. 🚀 这款PPT转Markdown的工具真的强到爆炸!支持所有格式转换,效果绝了!建议直接试试! 🔥

    回复
  2. 这工具简直是完美的幻灯片转Markdown神器!支持的所有功能简直无懈可击!尤其是自定义标题和图片处理,简直让我爱不释手!

    回复

发表评论