资源文件

type
status
date
slug
summary
tags
category
icon
password
通过编辑器插入的附件会被认为是资源文件,默认放置在 工作空间/data/assets/ 文件夹下。

插入图片或文件

在编辑器中可以直接粘贴系统剪切板中复制好的图片或文件(Linux 端不支持),或者通过拖拽图片或文件到编辑器中也可以实现插入。插入时有两个选择:
  • 复制为资源文件并插入:将图片或文件复制为资源文件并插入,快捷键 Ctrl+V
  • 使用 file:// 绝对路径并链接:将图片或文件以本地绝对路径方式插入超链接,快捷键 Ctrl+Shift+V,或者按住 Alt 后拖入
 
对于图片,如果排版时指定了图片标题,则标题会被渲染在图片下方作为图注。
notion image
 
⚠️
注意:
插入图片不会进行压缩处理,所有图片和文件都以原始数据进行保存。

清理未引用资源

思源里直接删除文档的图片或者附件(统称为资源)不会被立即删除,因为有可能其他文档也有引用,如果所有文档里都没有引用这些资源,它们就会出现在设置资源未引用的资源文件 中,点击删除即可批量删除,如果文件过多可以多次点击。
动画示例
notion image
⚠️
注意:
这里的删除其实也不是完全删除,会生成历史文件在历史文件夹,通过历史文件夹还能复原或者永久删除。
 

详细解释

引用”指的是通过超链接、插入图片或者 HTML 标签(例如 <img><iframe>)的属性 src 对资源文件进行链接。这里分为两种情况:
  1. 引用具体的资源文件,比如图片或者文件。如果资源文件是 PDF 且做过标注,那么无论它是否被引用都不会计入清理
  1. 引用资源文件夹(在 assets 文件夹下的子文件夹),必须以 / 结尾,比如 [foo](assets/bar/)。一个资源文件夹如果被引用,则下面所有资源文件无论是否被单独引用,都会被算作已经引用
设置资源 中可以一键清理未引用资源,如果需要找回被误删的文件,请通过回滚。
 
⚠️
注意:
使用绝对路径(本地路径或者是网络路径)不会纳入清理计算。

查看丢失资源

在设置​ - 资源​ 中可以查看丢失的资源,复制路径后可以在全局搜索中找到引用处。
⚠️
注意:
搜索资源文件路径需要先启用 设置搜索索引资源文件路径

笔记本级资源文件

如果需要默认将插入的资源文件放置在文档同级 assets 文件夹下,则需要先手动创建名为 assets 的文件夹,这样思源会优先选择该 assets 文件夹来存放资源文件。
建议尽量不要使用笔记本级资源文件,因为这会带来一些副作用:
  • 删除该笔记本时,为保证跨笔记本资源文件引用正常工作,该笔记本下的资源文件会被批量复制到全局 assets 中
  • 不支持在数据历史中查看笔记本级资源文件历史
  • 不支持使用 /资源 搜索
  • 不支持重命名

图片 OCR 提取文本

该特性仅在桌面端支持,并且需要先手动安装 Tesseract OCR 程序。
​#注意#​:
  • 在安装 Tesseract OCR 时需要勾选你需要的语言包,并将安装后的 Tesseract-OCR 目录路径添加到环境变量 PATH​ 中,这样思源才能直接调用 tesseract​ 命令进行图片 OCR 提取文本。如果安装正常的话,在内核启动日志中可以搜索到 tesseract-ocr enabled​;如果要禁用 OCR,请设置环境变量 SIYUAN_TESSERACT_ENABLED=false
  • 思源并不会启用所有已安装的语言包,因为语言包太多的话会导致 OCR 缓慢甚至超时返回空结果,并且占用过多的系统资源,所以默认最多只会启用 eng​、chi*​、fra​、spa​、deu​、rus​ 和 osd​,如果你需要更准确的语言支持,可以通过配置环境变量 SIYUAN_TESSERACT_LANGS​ 来指定语言包,比如 SIYUAN_TESSERACT_LANGS=chi_sim+eng
  • 仅支持 png 和 jpg 格式的图片
  • 默认只对 2MB 以下的图片进行处理,如果需要调整,可以通过环境变量 SIYUAN_TESSERACT_MAX_SIZE​ 设置,值的单位是字节,比如:SIYUAN_TESSERACT_MAX_SIZE=4000000​ 将上限调整为 4MB
图片 OCR 提取文本过程是自动在后台进行的,目前仅支持 PNG、JPG 图片。提取的文本会被用于搜索功能,这样就能通过文本关键字来定位图片。

手动调整 OCR 结果

OCR 的结果保存在 工作空间/data/assets/ocr-texts.json​ 中,可通过下面的方式调整 OCR 结果:
  • 退出思源后在文件系统上修改该文件(请注意 JSON 格式的正确性)
  • 或者在编辑器中的图片元素菜单中选择 ​
    • OCR
调整完以后需要手动重建索引。
上一篇
Docker 伺服
下一篇
PDF 标注
Loading...

思源笔记用户指南

文章列表
思源笔记用户指南
🍼新手引导
✏️基础操作
⛓️基础块
🧬高级块
📊数据库
🔡代码片段
🔍搜索进阶
🚀高级操作
💎会员特权
💠功能特性
🖼️主题推荐
🔌常用插件
💬交流区