网站PDF文件的优化技巧
时间:2023年11月30日
/来源:网络
/编辑:佚名
我们在网站搜索某些资料时进场会看到一些PDF文件,并且排名都非常的好,那么我们要怎么去对这些PDF文件进行优化呢?下面章力分享一些PDF文件优化技巧。
我们发现在一些重要的关键词排名中,有的PDF 文件排名居然很靠前,于是我特意去学习研究了一下,现在拿出来和大家分享下。PDF 文件可是个宝,GOOGLE 会给 WORD 和 PDF 文件自动分配一个很高的权重,他们权重的关系是这样的WORD>PDF>HTML。所以一定要重视它,但是 GOOGLE 对于 PDF 的收录并不是很好,所以也不要完全依靠它,只能说我们尽力去就可以了。 PDF 优化分为文件优化和内容优化,总之记住一点就可以,PDF 文件也是被当作 HTML文件收录的,他们和 HTML的优化是一样的。下面是小东北总结的一些关于 PDF 的优化。
一、 PDF文件优化
1. 确定你的 PDF 文件是基于文本的,否则用其他程序打开 PDF 文件可能会发生一些问题。还有保证你的网站是以文本为主的网站而非“图片式网站”。这第一点应该很明显,如果你的 PDF放在“图片式网站”里,搜索引擎抓取不到你的站,自己你的 PDF 也不用指望有好的排名。
2. 优化 PDF文件属性中的 title 标题一项 (文件>>文档属性)。属性中的标题 title (不是文件名称)会变成title 标签,并且在搜索引擎的搜索结果页面也会显示这个标题。这里也要顺便优化 description和 keywords这些和 HTML 优化是一样的。
3. 不要忘记可用性。你要知道不是每个人使用的都是 Adobe Reader 的最新版本,所以你要尽量将你的 PDF 文件保存为低的版本,建议使用 PDF 1.5 或以下版本。
4. 链向 PDF的超文本链接中要包含关键字。
5. 注意放置 PDF 的位置。如果你把 PDF 的超级链接放到网站结构的越深层次,搜索引擎越难收录它。如果希望你的 PDF 文件有较好的排名,将 PDF放在较接近根目录的浅层次目录比较好。
6. 对文件的大小优化。不要放一个太大的 PDF 下载,这不仅会对用户造成不便,而且也加重搜索引擎的负担,如果它太大,搜索引擎可能会放弃抓取它,因此选择合适大小或最快网页浏览的大小都是不错的。
二、 PDF内容优化
1. 在 PDF 里加入链接。很多人以为 PDF 就像一些打印的文本一样是静态的,但事实上搜索引擎有时可以识别出 PDF 里的链接。可能因为搜索引擎识别出 PDF里链接的的机率大家认识不是很大,所以大部分人都没有在 PDF 里加链接。随着搜索引擎技术的发展以及 PDF 资源的增多,为了更好地抓取 PDF 的内容,搜索引擎对 PDF链接的识别能力将会越来越高,此外如果此 PDF 被传播给其它用户,新用户可以通过 PDF里的链接容易地链回网站,这也是一个不错的病毒营销。
2. 优化搜索引擎对 PDF的描述。对于网页,有一个网页描述(meta description )可以让搜索引擎在主题下显示对网页的描述,虽然 PDF 没有这项功能,但我们仍然可以有办法让搜索引擎在 PDF 的描述位置显示我们希望出现的东西。最好的方法就是在 PDF 文章内容的第一段或最晚不超出第三段时,出现 PDF 的标题和 PDF 的关键字,让这些关键字词融合入到段落中。这里说明下,上面我们填了个 discription,但是 GOOGLE 对于 PDF 的描述有时并不是显示那里面的内容,而是抓取每段的前几句话(不包括关联词)。
3. 调整 PDF 的阅读顺序。每一个 PDF 都有一个阅读顺序,将你认为有价值的东西放在靠前的位置。打开完整版本的 Acrobat,选择高级选项里的增加标签的一项,然后为文档增加标签来标记他们的优先级。不过一般最简单的办法还是在文章的自然段中将有价值的东西概括成一段概述放在第一段,那就不用再去进行一些麻烦的设置了。
4。图片优化。在每一个图片下面放上一小段话,这样抓取的时候,就会被当作图片的ALT 属性。
从上面这些你可以看到,其实 PDF 文件也和 HTML 文件优化一样。当然这些同样适用于WORD 文件。但WORD的应用没有PDF广泛
我们发现在一些重要的关键词排名中,有的PDF 文件排名居然很靠前,于是我特意去学习研究了一下,现在拿出来和大家分享下。PDF 文件可是个宝,GOOGLE 会给 WORD 和 PDF 文件自动分配一个很高的权重,他们权重的关系是这样的WORD>PDF>HTML。所以一定要重视它,但是 GOOGLE 对于 PDF 的收录并不是很好,所以也不要完全依靠它,只能说我们尽力去就可以了。 PDF 优化分为文件优化和内容优化,总之记住一点就可以,PDF 文件也是被当作 HTML文件收录的,他们和 HTML的优化是一样的。下面是小东北总结的一些关于 PDF 的优化。
一、 PDF文件优化
1. 确定你的 PDF 文件是基于文本的,否则用其他程序打开 PDF 文件可能会发生一些问题。还有保证你的网站是以文本为主的网站而非“图片式网站”。这第一点应该很明显,如果你的 PDF放在“图片式网站”里,搜索引擎抓取不到你的站,自己你的 PDF 也不用指望有好的排名。
2. 优化 PDF文件属性中的 title 标题一项 (文件>>文档属性)。属性中的标题 title (不是文件名称)会变成title 标签,并且在搜索引擎的搜索结果页面也会显示这个标题。这里也要顺便优化 description和 keywords这些和 HTML 优化是一样的。
3. 不要忘记可用性。你要知道不是每个人使用的都是 Adobe Reader 的最新版本,所以你要尽量将你的 PDF 文件保存为低的版本,建议使用 PDF 1.5 或以下版本。
4. 链向 PDF的超文本链接中要包含关键字。
5. 注意放置 PDF 的位置。如果你把 PDF 的超级链接放到网站结构的越深层次,搜索引擎越难收录它。如果希望你的 PDF 文件有较好的排名,将 PDF放在较接近根目录的浅层次目录比较好。
6. 对文件的大小优化。不要放一个太大的 PDF 下载,这不仅会对用户造成不便,而且也加重搜索引擎的负担,如果它太大,搜索引擎可能会放弃抓取它,因此选择合适大小或最快网页浏览的大小都是不错的。
二、 PDF内容优化
1. 在 PDF 里加入链接。很多人以为 PDF 就像一些打印的文本一样是静态的,但事实上搜索引擎有时可以识别出 PDF 里的链接。可能因为搜索引擎识别出 PDF里链接的的机率大家认识不是很大,所以大部分人都没有在 PDF 里加链接。随着搜索引擎技术的发展以及 PDF 资源的增多,为了更好地抓取 PDF 的内容,搜索引擎对 PDF链接的识别能力将会越来越高,此外如果此 PDF 被传播给其它用户,新用户可以通过 PDF里的链接容易地链回网站,这也是一个不错的病毒营销。
2. 优化搜索引擎对 PDF的描述。对于网页,有一个网页描述(meta description )可以让搜索引擎在主题下显示对网页的描述,虽然 PDF 没有这项功能,但我们仍然可以有办法让搜索引擎在 PDF 的描述位置显示我们希望出现的东西。最好的方法就是在 PDF 文章内容的第一段或最晚不超出第三段时,出现 PDF 的标题和 PDF 的关键字,让这些关键字词融合入到段落中。这里说明下,上面我们填了个 discription,但是 GOOGLE 对于 PDF 的描述有时并不是显示那里面的内容,而是抓取每段的前几句话(不包括关联词)。
3. 调整 PDF 的阅读顺序。每一个 PDF 都有一个阅读顺序,将你认为有价值的东西放在靠前的位置。打开完整版本的 Acrobat,选择高级选项里的增加标签的一项,然后为文档增加标签来标记他们的优先级。不过一般最简单的办法还是在文章的自然段中将有价值的东西概括成一段概述放在第一段,那就不用再去进行一些麻烦的设置了。
4。图片优化。在每一个图片下面放上一小段话,这样抓取的时候,就会被当作图片的ALT 属性。
从上面这些你可以看到,其实 PDF 文件也和 HTML 文件优化一样。当然这些同样适用于WORD 文件。但WORD的应用没有PDF广泛
新闻资讯 更多