加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_泰州站长网 (http://www.0523zz.com/)- 视觉智能、AI应用、CDN、行业物联网、智能数字人!
当前位置: 首页 > 站长资讯 > 评论 > 正文

和程序员打官司是一种怎样的体验

发布时间:2016-05-27 12:36:44 所属栏目:评论 来源:歪理邪说
导读:第一次开庭审理完成,该公开的东西也基本都公开了。我就可以来说说为什么要打这场官司,以及在这场公司里面我们有什么样的创新了,因为这些创新,它成了一个值得原创作者、

打官司 程序员 体验

文/歪理邪说

前述起诉杭州麻瓜网络科技有限公司(公众号“差评“运营方)疑似抄袭案5月23日在杭州第一次开庭审理结束,当场未能作出判决,审判长宣布择日开庭再申。需要再次开庭也说明了这个案件有一定复杂性,可见我之前说的没错,这是一个有趣的案子。 

第一次开庭审理完成,该公开的东西也基本都公开了。我就可以来说说为什么要打这场官司,以及在这场公司里面我们有什么样的创新了,因为这些创新,它成了一个值得原创作者、媒体人、法律届和计算机技术行业共同关注的案子。

很多人好奇打这个官司的目的是什么。通常看到索赔标的1块钱的案子,大家都明白,它的目的一定不是赔偿本身。据说被告方项目的投资人在朋友圈破口大骂,说我是炒作。看到这种奇怪的事情只能想到炒作这一个目的,这恐怕是个境界问题。

对于这个案子,我真正的目的是“测试”。这是非常工程师的思路,做为工程师,如果我们发明了一种办法,一定会实施它,并且在现实中验证它的可行性。而我需要验证的这个方法,只能在法庭上验证,于是就有了本案。

在法庭上,我方律师询问被告方,在创作被告涉案文章之前,是否阅读过原告文章(也就是我写的Telegram那篇文章)。被告表示“没看过,是之后才看过的”。之后我方律师出示了一份证据,这份证明表明了在原告文章和被告文章中,都出现了两个短句:

“兼具数学和工程之美” 

“最底层的简单API实现”

这两个短句看起来很普通,但如果用搜索引擎分别搜索这两个短句,无论是Google还是百度,都会发现使用过这两个短句中任何一个的文章都只有两篇(在本案立案时),分别是我原始的文章和被告的涉案文章,以及各种对这两篇文章的转载。公众号的发表时间可以证明,我的文章在前,他们的文章在后。这充分证明了两者是有关联的,并非被告律师所说的“独立创作”。被告律师在几分钟之前在法庭上表示的“没看过”,也就不成立了。

打官司 程序员 体验

图:两文对比。他们说之前没看过我的文章显然是撒谎。

我是如何做到这件事的?这其实就是我想通过本案验证的东西。我还没给它正式命名,估计“文字标记”或者“文字信标”之类的名字会比较符合它的含义。

这个办法的具体做法如下:

在符合中文语法的情况下,通过改变词语搭配,使用同义词和形容词的组合和堆叠,来创造一个历史上没被人使用过的短句。

在一篇创作完成的文章中,寻找一些合适的句子,用这样独一无二的短句替换它。

间隔一段文字就进行一次这种替换。让独一无二的短句在文章中达到一定密度。

具体用本案的证据为例,如果说“底层API实现”,用搜索引擎一搜,可以搜到很多文章用过。于是我变换了这个句子,变成“最底层的简单API实现”。其中形容词““和形容词"简单“都是多余的,但是加上它们之后,就变成了之前没人用过的句子,并且仍然符合中文语法,也不会破坏本来要表达的意思。于是我们就通过堆叠形容词,得到了独一无二的短句“最底层的简单API实现”。另外一个例子也一样,如果写“数学和科学之美”,这就是一个常用的短句,把“科学”换成“工程”,就变成了独一无二的了。我还可以继续修改它,比如“精致的数学和工程之美”,或者“精致的数学和复杂的工程之美”…总之,总是可以通过这种堆叠和替换找到一个合适的短句。

为什么要这样做?因为知识产权案件中”独立创作“本身是案件的关键因素。我国著名法学家程荣斌先生所著的《知识产权法: 案例法规试题》一书中有以下论述:“独立创作着眼于从创作过程考察作品…指作者独立于其他作品创作,即在创作过程中没有抄袭或复制其他作品的行为。”。可见,证明对方有实际直接的抄袭行为就是关键。当我做为原始作者把这样独一无二的短句放在原文之中,如果抄袭方抄走这样的短句,放在了他的新文章中。这就是对方抄袭而非“独立创作“的直接证据。可以很容易证明两篇文章是有关联的。从而推翻关于“独立创作”的辩护,推翻这一点之后,其他的证据组合就可以发挥更大的效果,巧合就不再是简单的巧合。这两个短句很小,但它们就像两根钉子,钉住了对方。

资深媒体人们(比如被告公司)所擅长的“洗稿“手法,也恰好是利用著作权法的这种解释。他们通常自我辩护“我们是通过一样的公开材料创作的作品”。虽然是雷同的作品,在司法上不一定能就此认定他们是抄袭。有了我的“文字信标”之后,事情恐怕就会有一些改变了。

以上解释有一点罗嗦,用一个不太恰当的类比,它就像你知道别人要抄你的试卷,于是你故意在卷子里面写几个错字,等着对方连同错字一起抄走。 微信的原创保护是一种被动防御手段,我这个办法算是主动防御。

被告方显然是熟练应用洗稿这门艺术,除了我之外,还有不少原创作者跟我吐槽过被他们通过用洗稿的办法抄袭。在微信的体系里面,这种办法确实可以逃过微信原创系统的检测,但想逃过我这个标记难度就大了很多。的确,我们永远不可能断绝抄袭行为, 别说写文章,就算学术论文的抄袭检测已经严格到今天这种地步后果又非常严重,每年仍然有大量的人以身试法,更别说写一篇文章了。不过我们仍然可以通过一些办法,大大增加抄袭成本。微信的原创保护是通过技术方法前进了一大步,我这种办法也是一样,同样是使用技术方法把这件事往前推动一步,增加抄袭成本,双方的斗争会一直持续下去。

为什么会想出这个办法?我多年从事搜索引擎相关工作,基本就是跟文字、分词、文本相似、文字指纹、ranking这些东西打交道。这是一脉相承的技术思路,既然我们可以判断文本相似性完成搜索,一样可以通过搭配来创造唯一的句子。创建这种独一无二的句子通过“程序+人工”的方式,成本是很低的。但对于抄袭方,找出来这些句子成本就高了很多。因为它完全符合语法,只改动搭配和形容词,语法检测也很难找到它们(何况中文本来就是弱语法的,我们每天都在创造无数的病句)。如果通过此案证明了这种方法可以被法院认可,那么就可以推广它,从而为原创作者和知识产权领域做一点点贡献。

(编辑:云计算网_泰州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读