批量地址生成器
 第一页地址:
 第二页地址:
  总页面数:

 




  地址模式定制器
页面源代码:

地址样例一:
地址样例二:


  后向比较地址

模式:
格式:





  信息模式定制器
脚本编辑框:

  整行最少字符数:

格式化选项:




必须存在 (e)
不输出  (n)
值唯一  (u)
大文本  (m)

含标题   含源页面地址


模式:
格式:
备注:





使用帮助:

许多用户想用 InfoSeek/FastSeek 自己搜索信息,但不会定制模式。这里以用 InfoSeek 和“搜索伴侣”搜索常见的分页网站类型为例,给出了详细的使用方法和搜索步骤。
用以下分页网站举例说明,左边为网站第一页内容,右边为第一页里的第一贴内容。现在的任务是搜索100页中所有帖子里的联络信息。

第一页:贴子一:
第 1 页

帖子一......................
帖子二......................
帖子三......................
帖子四......................
帖子五......................

页面: 1 2 3 4 5 共 100 页
上一页
北京市食品公司

地址:北京市朝阳区东四环南路邮编:100022联系人:李培生
电话:010-67477614传真:010-67474524
电邮:g7111@sohu.com网址:http://www.yahoo.com
简介:

XXXXXXXXXX
XXXXXXXXXX
XXXXXXXXXX

下一页


注意:以下操作需要先导入两个搜索任务:在 InfoSeek 中选菜单:“编辑”>>“任务”>>“导入”,选择 InfoSeek 安装目录下的“Data”子目录,将里面的“分页地址.ini”和“页面信息.ini”两个文件导入,回到主界面后会看到新增了两个任务:“分页地址”和“页面信息”。

第一步:搜索所有页面中帖子的地址(使用 InfoSeek 的“分页地址”任务搜索)

1. 定制“分页地址”模式

使用“地址模式定制器”,把第一页的源代码复制到“页面源代码”编辑框内。如下所示:

(页面源代码)

选择两个不同的帖子超链接,例如: 帖子一帖子二, 将其地址复制到“地址样例一”和“地址样例二”内。如下所示:

地址样例一:
地址样例二:

点击“地址模式”按钮,得到模式的内容和格式。打开 InfoSeek 的设置对话框(选菜单“文件”>>“设置”),到“模式”栏下,将数据复制到“分页地址”模式内。

复制页面源代码方法:在页面上按鼠标右键,选“查看源文件”(或者选IE菜单“查看”>>“源文件”),在打开的记事本中复制所有文本。
复制超链接方法:将鼠标移动到超链接上,按鼠标右键选“复制快捷方式”。


2. 添加搜索地址后搜索

将第一页地址,第二页地址,总页面数分别输入到“批量地址生成器”中的相应位置,点击输出地址,复制生成的压缩格式。如下所示:

第一页地址:(打开第二页,将鼠标移动到超链接 1 上,复制链接地址)
第二页地址:(将鼠标移动到超链接 2 上,复制链接地址)
 总页面数:(页面上一般会标有该数字)
 压缩格式:(点击“输出地址”按钮后,复制生成的压缩格式待用)

到 InfoSeek 中,先选中“分页地址”任务,然后在右下窗口按鼠标右键,选“添加>>添加...”,在打开的对话框中,将压缩格式复制到编辑框内,点“确定”回到主界面。 双击“分页地址”任务开始搜索,搜索完成后复制出左窗口内的结果(所有帖子的地址)。



第二步:搜索所有帖子中的联络信息(使用 InfoSeek 的“页面信息”任务搜索)

1. 定制“页面信息”模式

使用“信息模式定制器”,在脚本编辑框内输入脚本,每行为一个单位,语法为:
·标题字符串<行中>“<行中>”表示标题对应的内容到一行中间结束。“标题字符串”表示搜索域的标题,比如“电子邮件”,“电话”,“传真”等。
·标题字符串<行尾>“<行尾>”表示该标题对应的内容到该行行尾结束。
·标题字符串<多行>“<多行>”表示该标题对应的内容为多行。
·自定义标题<整行>“<整行>”表示这是一个没有标题的行(整行都是内容)。“自定义标题”是用户自己为这一行定义的标题,必须以'$'开头。
·定位字符串定位字符串不对应搜索内容,一般用来表示行中和多行的结束标志字符串,整行的开始或结束标志字符串。

注:“<行中>”,“<行尾>”或“<多行>”前的“标题字符串”如果不存在,可以用“自定义标题”代替。“自定义标题”必须以'$'开头。

例一:搜索所有域的信息。 例二:搜索“地址”,“联系人”,“网址”。 例三:搜索“邮编”,“电话”,“简介”。

输入完成后点击“信息模式”按钮得到模式内容。打开 InfoSeek 的设置对话框(选菜单“文件”>>“设置”),到“模式”栏下,把数据复制到“页面信息”模式内。


2. 添加搜索地址后搜索

到 InfoSeek 中,先选中“页面信息”任务,然后在右下窗口按鼠标右键,选“添加>>添加...”,在打开的对话框中,将第一步搜索到的结果复制到编辑框内,点“确定”后回到主界面。 双击“页面信息”任务开始搜索,搜索完成后复制出左窗口内的结果。

界面说明

地址模式定制器:

后向比较地址:查找地址样例尾部相同的字符串。如果地址总有相同的尾部字符串(例如:abc.chem17.com 和 derun.chem17.com),选择该项,可使生成的模式更加精确。


信息模式定制器:

行中:将字符串“<行中>”复制到剪贴板,用于粘贴。
行尾:将字符串“<行尾>”复制到剪贴板,用于粘贴。
多行:将字符串“<多行>”复制到剪贴板,用于粘贴。
整行:将字符串“<整行>”复制到剪贴板,用于粘贴。
整行最少字符数:一行字符数低于此设定值,则不匹配该整行。

(格式化选项)
含源页面地址:输出格式的第一字段为源页面地址,使用该地址可浏览原来的页面内容。

(字段属性)
必须存在:表示在一个搜索到的项目中,该字段的内容不能为空,如果为空,导出时将不保存该项。
不输出:导出项目时,将该字段的内容存为空值。
值唯一:导出项目到数据库时,该字段的内容不能有重复。
大文本:一般字段的长度在255个字节以内,大文本可以是256到32768个字节。

分析格式:根据当前格式和备注中的内容,取得格式化选项的值,然后可以调整字段属性和位置等。



常见问题

·使用“批量地址生成器”,生成的地址有误?
注意第一页地址的复制方法,应该先切换到其它页面(如第二页),然后把鼠标移动到第一页的超链接上复制。不要直接在第一页上复制IE地址栏内的地址。

·使用“批量地址生成器”,第一页和第二页地址已正确复制,但生成的地址不能搜索?
检查不同页的地址中,是否只有一个按数字变化的值,如果有一个以上的变量,或者某个变量不是数字形式(按数字变化),则不能使用“批量地址生成器”。

·第一步搜索完成后地址不能导出,如何测试第二步?
未注册版本的 InfoSeek 不能导出搜索结果。如果想测试一下第二步搜索,可以先选中搜索到的一个结果,在右键菜单中选“编辑”,然后在弹出的编辑框中复制其内容。

·浏览器显示“网页脚本错误”或不输出结果?
关闭杀毒软件的网页防火墙,并确保使用的是 IE 浏览器且 JavaScript 功能已打开。


技巧与提示

·对 FastSeek,可用“地址模式定制器”定制目标地址模式,用“信息模式定制器”定制要搜索的信息模式。
·定制信息模式时,先将目标网页内容全选(Ctrl+A),复制后针对其内容分析(如果直接对网页显示内容分析,可能会有误差)。
·定制信息模式时,将脚本编辑框内输入的脚本内容复制后保存好,以便下次修改时直接粘贴过来。
·信息模式定制器适用于页面格式固定的网页定制,如需定制其它复杂页面,请联系我们:support@allweb-soft.com 或 QQ:3967543。
·要下载“搜索伴侣”的最新版本,请访问我们的站点:http://www.allweb-soft.com/cn


常用快捷键

Ctrl+A:全选。(或按住Ctrl键,在编辑框中点击鼠标左键)
Ctrl+C:拷贝。
Ctrl+V:粘贴。
Ctrl+X:剪切。

Copyright ©2000-2006 版权所有 全网软件. All Rights Reserved. 保留全部权利