一种互联网文内关键字广告的生成和投放方法

著录项
  • CN200810040997.8
  • 20080725
  • CN101324890
  • 20081217
  • 上海视信息科技有限公司
  • 徐国荣;金轶;胡英航;蒋文安
  • G06F17/30
  • G06F17/27 G06Q30/00 G06F17/30

  • 上海市卢湾区思南路84号103室
  • 中国,CN,上海(31)
  • 上海伯瑞杰知识产权代理有限公司
  • 季申清
摘要
本发明涉及互联网上的一种智能信息发布技术领域,特别是一种互联网文内关键字广告的生成和投放方法。其内容从网民浏览、获取广告脚本(JavaScript语言),将用户信息回传至服务器及提取编码信息和正文内容、过滤无用的标签等,通过中文分词技术动态生成有广告投放的关键字词库,到将格式化成JavaScript脚本的广告回传给客户端等。具有提供用户可自助设置广告投放区域、行业等属性和选择具体的网站的技术以及高度的定制化功能,选择自己的广告框、广告弹出时的表现形式,上传及编辑图片、视频等功能,集结合关键字、文章主题、用户兴趣爱好分析等多种核心技术及强大的兼容性,极大地提高系统的效率。
权利要求

1.一种互联网文内关键字广告的生成和投放方法,其特征是,

第一步:网民浏览已加载有本发明标定的代码的网页;

如果当前电脑上已安装本发明客户端软件,则自动加载本发明标 定的代码;

第二步:网民从本发明标定的服务器获取完整的和当前网页相关 的广告脚本——Java Script语言,并加载运行;

第三步:广告脚本判断当前网民浏览的页面是否需要登录才能正 常访问;如果需要登录,则直接获取页面的正文内容,即Content字 段;

如果不需要登录,那么Content字段留空;

第四步:客户端广告脚本将用户信息,当前网页网址以及网页内 容的数据传送到本发明标定的服务器;

第五步:如果服务器从客户端接收的Content字段为空,则转到 第六步;

如果不为空,则转到第八步;

第六步:根据网址获取网页的源代码;

第七步:从网页的源代码当中提取网页的编码信息和正文内容, 过滤掉链接无用的标签;

第八步:针对提取的网页正文内容,做中文分词,直接得到有广 告投放的关键字,动态生成分词的词库;

第九步:针对每个广告关键字动态搜索广告内容;

第十步:将格式化成Java Script脚本的广告内容回传给客户 端;

第十一步:客户端根据接收到的广告内容即Java Script脚本, 给关键字划线;如果用户触发,即弹出相应的广告。

2.如权利要求1所述的一种互联网文内关键字广告的生成和投 放方法,其特征是,所述的中文分词程序,包括分词算法和分词词库; 所述的分词算法是把中文的汉字序列切分成有意义的词;所述的分词 词库是动态生成的,且由广告商购买的广告关键字组成。

3.如权利要求1或2所述的一种互联网文内关键字广告的生成和 投放方法,其特征是,所述的动态索引是指动态建立广告数据索引数 据库,由索引程序对广告商信息,广告投放数据,网站主信息,网站 数据进行分析和计算,得到每一个广告关键字与购买过此关键字的广 告的相关度、重要性,然后用这些相关信息建立广告数据索引数据库。

4.如权利要求1-3中任一所述的一种互联网文内关键字广告的 生成和投放方法,其特征是,所述的缓存优化是通过缓存系统实施, 缓存系统可以在系统的多个步骤中实施,包括针对某个具体页面的广 告投放数据、针对某个具体页面的正文内容和针对某个具体网站上特 定关键字的广告数据。

5.如权利要求1-4中任一所述的一种互联网文内关键字广告的 生成和投放方法,其特征是,包含支持IE6.0、IE7.0、Firefox、Opera、 Netscape和Safari主流浏览器,以及以IE为内核的浏览器,MyIE、 遨游、腾讯TT。

说明书
技术领域

技术领域

本发明涉及互联网上的一种智能信息发布技术,特别是一种互联 网文内关键字广告的生成和投放方法。

背景技术

1997年3月,CHINABYTE网站上出现了第一条商业性网络广告, 标志着中国网络广告的诞生。经过9年多的发展,中国网络广告市场 规模至2007年已经达到106.1亿元人民币。当前流行的网络广告主 要有网页广告、搜索引擎广告、广告、在线游戏广告、软件 广告等几大类别。纵观上述传统技术,存在共同问题是都占有固定现 有广告位。而文内关键字广告技术,不但不占有广告位,而且形式更 加多样、投放更加精准,已经成为互联网广告行业发展的巨大动力。 目前市场上有多种类似的广告技术出现,但由于技术上的原因,无法 处理某些需要登录才能访问的页面,例如论坛等;其次是其覆盖范围 只有放置其代码的网站,没有放置代码的网站就无能为力了;最后就 是投放效率不高,投资回报不明显的问题。

发明内容

本发明的目的是为了克服上述现有技术存在的不足,提供一种不 占有固定广告位的文内关键字广告投放技术。本发明一种互联网文内 关键字广告的生成和投放方法(如附图1、2所示):

第一步:网民浏览已加载了本发明标定的代码的网页;

如果当前电脑上已安装本发明客户端软件,则自动加载本发明标 定的代码。

第二步:网民从本发明标定的服务器获取完整的和当前网页相关 的广告脚本(Java Script语言),并加载运行。

第三步:广告脚本判断当前网民浏览的页面是否需要登录才能正 常访问,如果需要登录,则直接获取页面的正文内容,即Content字 段;

如果不需要登录,那么Content字段留空。

第四步:客户端广告脚本将用户信息,当前网页网址以及网页内 容的数据传送到本发明标定的服务器。

第五步:如果服务器从客户端接收的Content字段为空,则转到 第六步;

如果不为空,则转到第八步。

第六步:根据网址获取网页地源代码。

第七步:从网页的源代码当中提取网页的编码信息和正文内容, 过滤掉链接等无用的标签。

第八步:针对提取的网页正文内容,做中文分词,直接得到有广 告投放的关键字,动态生成分词的词库。

第九步:针对每个广告关键字动态搜索广告内容。

第十步:将格式化成Java Script脚本的广告内容回传给客户 端。

第十一步:客户端根据接收到的广告内容即Java Script脚本, 给关键字划线,如果用户触发,即弹出相应的广告。

关于本发明涉及的相关技术的说明

本发明所述的中文分词技术,就是把中文的汉字序列切分成有意 义的词,例如:我是一个学生,分词的结果是:“我是”“一个”“学 生”。

中文分词系统主要是两大部分,即分词算法部分和分词词库部 分;对词库部分做了两大改进:动态生成词库和由广告商购买的广告 关键字组成词库。

本发明所述的动态索引是指动态建立广告数据索引数据库,由索 引程序对广告商信息、广告投放数据、网站主信息和网站数据进行分 析和计算,得到每一个广告关键字与购买过此关键字的广告的相关度 (或重要性),然后用这些相关信息建立广告数据索引数据库。

本发明所述的缓存优化是通过缓存系统来优化整个系统的效率, 缓存系统可以在系统的多个步骤中实施,包括针对某个具体页面的广 告投放数据、针对某个具体页面的正文内容以及针对某个具体网站上 特定关键字的广告数据。

本发明具有以下技术创新:

提供了需要登录的页面,也可以获取页面正文内容,并且投放广 告的功能。

提供了用户可以自助的设置广告投放区域,行业等属性和选择具 体的网站的技术以及高度的定制化功能,即可以选择自己的广告框, 广告弹出时的表现形式等,自助的上传并且编辑图片,视频等。

提供的广告形式,不强制网民浏览,由用户触发而弹出。

非常强的兼容性,支持IE6.0,7.0,Firefox,Opera,Netscape 以及Safari等各种主流浏览器。

提供了IE浏览器插件技术,使用户访问所有的页面都可以看到 广告。

尤其是采用了包括“中文分词技术”、“缓存系统”和“动态建立 广告数据索引数据库”以及“结合关键字,文章主题,用户兴趣爱好 分析”等多种核心技术极大地提高系统的整体效率,以达到精准投放 的目标。

在投放方式上,有效地整合网民、广告商和网站媒体,由网民自 主地选择广告的显示。在投放流程上,更加高效、稳定。

本发明的主要优势在于:

第一、通过在客户端获取网页正文内容的方法来处理需要登录后 才能访问的页面的广告投放。

第二、“视”特有的网吧IE浏览器插件技术使得安装有“视” 客户端的每台电脑,打开每个网页的时都会自动加载“视”的广告 代码,并生成和投放“视”的文内关键字广告效果。

第三、投放性能的优化

(1)动态生成中文分词程序的词库,其内容是广告商购买的广 告关键字集合;

(2)动态索引广告数据,将广告数据格式化存放在嵌入式文件 数据库中;

(3)通过网络蜘蛛,对合作网站的页面内容进行预先的抓取;

(4)通过缓存系统的优化,使得广告投放和检索的效率更高。

综上所述,本发明的文内关键字广告技术,在投放方式上,有效 地整合网民、广告商、网站媒体。在投放流程上,更加高效,稳定。 为广告商提供精准广告服务和网络整合营销方案,使投入的回报效果 最大化。

附图说明

图1为本发明的一个实施实例的流程框图;

图2为本发明的另一个实施实例的流程框图。

具体实施方式

以下结合附图对本发明作进一步描述

一种互联网文内关键字广告的生成和投放方法,其步骤是(如附 图1、2所示):

第一步:网民浏览加载过本发明标定的“视”代码的网页,或 者当前电脑上安装了“视”的网吧客户端软件,这是“视”文内 广告的两种不同的投放途径,网吧的客户端软件使得所有安装了此客 户端的电脑打开所有的页面都会自动加载“视”的广告代码。

第二步:从本发明标定的“视”的服务器获取完整的“视” 广告脚本(Java Script语言),并加载运行。

第三步:判断网民当前浏览的页面是否是需要登录才能正常访 问。如果需要登录,那么直接获取页面的正文内容(Content字段为 正文内容),以解决在视的服务器上不能访问这类页面的问题;如 果不需要登录,那么Content字段留空。

第四步:将网站或者网吧的用户信息,以及网页内容等数据传送 到本发明标定的“视”的服务器。

第五步:如果从客户端接收的Content字段为空,则转到第六步; 如果不为空,则转到第八步。

第六步:根据网址获取网页的源代码。

第七步:通过网络蜘蛛,从合作网站网页的源代码当中提取网页 的编码信息和正文内容,过滤掉非正文内容的无用标签,进行预先抓 取。

第八步:启动中文分词程序,根据当前广告商购买的关键字动态 生成分词词库,对提取的网页正文内容进行中文分词,直接得到有广 告投放的关键字。

第九步:启动搜索程序,针对每个广告关键字搜索广告内容,并 将相应的广告数据格式化。

第十步:将格式化的广告内容(已经是Java Script脚本)回 传给客户端。

第十一步:客户端根据接收到的广告内容(Java Script脚本), 给关键字划线,如果用户触发的话,弹出相应的广告。

本发明的一个实施实例

一种互联网络文内关键字广告的生成和投放方法,其中,中文分 词程序,包括分词算法和分词词库,所述的分词算法是把中文的汉字 序列切分成有意义的词;所述的分词词库是动态生成的,且由广告商 购买的广告关键字组成。

所述的动态索引是指动态建立广告数据索引数据库,由索引程序 对广告商信息,广告投放数据,网站主信息,网站数据进行分析,根 据一定的相关度算法进行大量复杂计算,得到每一个广告关键字针对 购买过此关键字的广告的相关度、重要性,然后用这些相关信息建立 广告数据索引数据库。

所述的缓存优化是通过缓存系统来优化整个系统的效率,缓存系 统可以在系统的多个步骤中实施,包括针对某个具体页面的广告投放 数据、针对某个具体页面的正文内容和针对某个具体网站上特定关键 字的广告数据。

本文发布于:2024-09-25 02:23:52,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/73697.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议