第一页地址: 第二页地址: 总页面数: |
页面源代码:
地址样例一: 地址样例二: 后向比较地址 模式: 格式: |
脚本编辑框: 整行最少字符数: |
|
||||
模式: 格式: 备注: |
使用帮助:
许多用户想用 InfoSeek/FastSeek 自己搜索信息,但不会定制模式。这里以用 InfoSeek 和“搜索伴侣”搜索常见的分页网站类型为例,给出了详细的使用方法和搜索步骤。 用以下分页网站举例说明,左边为网站第一页内容,右边为第一页里的第一贴内容。现在的任务是搜索100页中所有帖子里的联络信息。
注意:以下操作需要先导入两个搜索任务:在 InfoSeek 中选菜单:“编辑”>>“任务”>>“导入”,选择 InfoSeek 安装目录下的“Data”子目录,将里面的“分页地址.ini”和“页面信息.ini”两个文件导入,回到主界面后会看到新增了两个任务:“分页地址”和“页面信息”。 第一步:搜索所有页面中帖子的地址(使用 InfoSeek 的“分页地址”任务搜索) 1. 定制“分页地址”模式 使用“地址模式定制器”,把第一页的源代码复制到“页面源代码”编辑框内。如下所示: (页面源代码) 选择两个不同的帖子超链接,例如: 帖子一 和 帖子二, 将其地址复制到“地址样例一”和“地址样例二”内。如下所示: 地址样例一: 地址样例二: 点击“地址模式”按钮,得到模式的内容和格式。打开 InfoSeek 的设置对话框(选菜单“文件”>>“设置”),到“模式”栏下,将数据复制到“分页地址”模式内。 复制页面源代码方法:在页面上按鼠标右键,选“查看源文件”(或者选IE菜单“查看”>>“源文件”),在打开的记事本中复制所有文本。 复制超链接方法:将鼠标移动到超链接上,按鼠标右键选“复制快捷方式”。 2. 添加搜索地址后搜索 将第一页地址,第二页地址,总页面数分别输入到“批量地址生成器”中的相应位置,点击输出地址,复制生成的压缩格式。如下所示: 第一页地址:(打开第二页,将鼠标移动到超链接 1 上,复制链接地址) 第二页地址:(将鼠标移动到超链接 2 上,复制链接地址) 总页面数:(页面上一般会标有该数字) 压缩格式:(点击“输出地址”按钮后,复制生成的压缩格式待用) 到 InfoSeek 中,先选中“分页地址”任务,然后在右下窗口按鼠标右键,选“添加>>添加...”,在打开的对话框中,将压缩格式复制到编辑框内,点“确定”回到主界面。 双击“分页地址”任务开始搜索,搜索完成后复制出左窗口内的结果(所有帖子的地址)。 第二步:搜索所有帖子中的联络信息(使用 InfoSeek 的“页面信息”任务搜索) 1. 定制“页面信息”模式 使用“信息模式定制器”,在脚本编辑框内输入脚本,每行为一个单位,语法为:
注:“<行中>”,“<行尾>”或“<多行>”前的“标题字符串”如果不存在,可以用“自定义标题”代替。“自定义标题”必须以'$'开头。
输入完成后点击“信息模式”按钮得到模式内容。打开 InfoSeek 的设置对话框(选菜单“文件”>>“设置”),到“模式”栏下,把数据复制到“页面信息”模式内。 2. 添加搜索地址后搜索 到 InfoSeek 中,先选中“页面信息”任务,然后在右下窗口按鼠标右键,选“添加>>添加...”,在打开的对话框中,将第一步搜索到的结果复制到编辑框内,点“确定”后回到主界面。 双击“页面信息”任务开始搜索,搜索完成后复制出左窗口内的结果。 |
界面说明
地址模式定制器: 后向比较地址:查找地址样例尾部相同的字符串。如果地址总有相同的尾部字符串(例如:abc.chem17.com 和 derun.chem17.com),选择该项,可使生成的模式更加精确。 信息模式定制器: 行中:将字符串“<行中>”复制到剪贴板,用于粘贴。 行尾:将字符串“<行尾>”复制到剪贴板,用于粘贴。 多行:将字符串“<多行>”复制到剪贴板,用于粘贴。 整行:将字符串“<整行>”复制到剪贴板,用于粘贴。 整行最少字符数:一行字符数低于此设定值,则不匹配该整行。 (格式化选项) 含源页面地址:输出格式的第一字段为源页面地址,使用该地址可浏览原来的页面内容。 (字段属性) 必须存在:表示在一个搜索到的项目中,该字段的内容不能为空,如果为空,导出时将不保存该项。 不输出:导出项目时,将该字段的内容存为空值。 值唯一:导出项目到数据库时,该字段的内容不能有重复。 大文本:一般字段的长度在255个字节以内,大文本可以是256到32768个字节。 分析格式:根据当前格式和备注中的内容,取得格式化选项的值,然后可以调整字段属性和位置等。 常见问题 ·使用“批量地址生成器”,生成的地址有误? 注意第一页地址的复制方法,应该先切换到其它页面(如第二页),然后把鼠标移动到第一页的超链接上复制。不要直接在第一页上复制IE地址栏内的地址。 ·使用“批量地址生成器”,第一页和第二页地址已正确复制,但生成的地址不能搜索? 检查不同页的地址中,是否只有一个按数字变化的值,如果有一个以上的变量,或者某个变量不是数字形式(按数字变化),则不能使用“批量地址生成器”。 ·第一步搜索完成后地址不能导出,如何测试第二步? 未注册版本的 InfoSeek 不能导出搜索结果。如果想测试一下第二步搜索,可以先选中搜索到的一个结果,在右键菜单中选“编辑”,然后在弹出的编辑框中复制其内容。 ·浏览器显示“网页脚本错误”或不输出结果? 关闭杀毒软件的网页防火墙,并确保使用的是 IE 浏览器且 JavaScript 功能已打开。 技巧与提示 ·对 FastSeek,可用“地址模式定制器”定制目标地址模式,用“信息模式定制器”定制要搜索的信息模式。 ·定制信息模式时,先将目标网页内容全选(Ctrl+A),复制后针对其内容分析(如果直接对网页显示内容分析,可能会有误差)。 ·定制信息模式时,将脚本编辑框内输入的脚本内容复制后保存好,以便下次修改时直接粘贴过来。 ·信息模式定制器适用于页面格式固定的网页定制,如需定制其它复杂页面,请联系我们:support@allweb-soft.com 或 QQ:3967543。 ·要下载“搜索伴侣”的最新版本,请访问我们的站点:http://www.allweb-soft.com/cn。 常用快捷键 Ctrl+A:全选。(或按住Ctrl键,在编辑框中点击鼠标左键) Ctrl+C:拷贝。 Ctrl+V:粘贴。 Ctrl+X:剪切。 |
Copyright ©2000-2006 版权所有 全网软件. All Rights Reserved. 保留全部权利 |