работа над ошибками

Copy Guard — попытка не защитана

11 мая 2008, 21:03
Глобальное Го: выжить за счёт параноиков.

Компания «Защита Информации» представила на последнем КиБе «CopyGuard» (далее — CG) — систему поддержки копирайта в интернет ( презентация CG ) . Коммерческая оферта компании для авторов и владельцев текстов состоит из трёх пунктов: найти, предупредить и предоставить владельцу доказательства факта и объема нарушения копирайта.

Есть ещё одно передложение, которое стоит вынести отдельным пунктом: депонирование, под которым владельцы сервиса понимают такую подзаконную услугу, как временную фиксацию приоритета. Вынести её отдельно обязывает сомнительность этой услуги сточки зрения сложившейся практики процедуры фиксации приоритета в авторском праве.

Почему я этим интересуюсь

Интеллектуальная собственность — актив который можно считать «парадоксальным». Не имея физического измерения, он обладает значительной удельной стоимостью, постоянством свойств, легко меняет своего номинального владельца без юридического оформления перехода и при этом имеет неопределённый срок полезного использования. Из первых двух свойств следует то, что при входе в право собственности нет особых условий по «весу входящего»: владельцем, с одинаковым успехом, может быть как глобальная корпорация, так и частное лицо. Остальные свойства — «свойства риска», благодаря которым право собственности сложно зафиксировать и охранять.

Оболочка любой нематериальной собственности — это словесное описание её особенностей, которые не оставляют у приобретателя сомнений в оригинальности, выделены в качестве уникальных и благодаря этому описанию могут быть переведены в режим зафиксированного приоритета или достаточно долго оставаться в секрете. Этот описательный процесс можно условно назвать «инкапсуляцией» — сворачиванием потока знаний в замкнутые структуры, обладающие интеграционными свойствами и которые могут быть использованы для создания интеллектуальных комплексов с заданными параметрами.

Поток инкапсуляции интеллектуальной собственности в учебных и исследовательских организациях идёт непрерывно. Другой вопрос — как сделать это процесс управляемым в рамках комплекса обособления, управления и капитализации.

Так сложилось, что преобладающая практика уже сформировала основную технологию обособления, управления, охраны и капитализации. Всё, что производиться в рамках интеллектуальной работы делиться на существенную часть, которая подлежит капитализации и «символические дары фронтира» — открытые публикации, выступающие в качестве вех, обозначающих границы достигнутого прогресса и предназначенные в качестве дара-жертвы соответствующему научному или техническому сообществу. Как символический дар они побуждают движущихся в том же направлении конкурентов, почти как в игре «Го», выставлять на глобальное интеллектуальное поле такие же или равнозначные «камни», которые обозначают для потенциального инвестора территорию, на которую претендует каждый из противников и подталкивают вперёд исследования конкурирующих групп.

В отличие от игры, где цвет камня неизменный и выставляет его один человек, на глобальном интеллектуальном поле сложно контролировать не только «выставление камней» — это может сделать любой из сотрудников по одному ему понятным мотивам, но и «цвет камня». Противник может «перекрасить камень» — поменять реквизиты выпущенной в публичное пользование информации на свои и тем самым ввести в заблуждение добросовестных приобретателей и инвесторов.

Резюмируя можно сказать, что для системы капитализации интеллектуальной собственности отслеживание и управление копирайтом в интернет — это контроль распространения по сети косточек Го и их цвета.

Инструмент

Пока CG работает в тестовом режиме. Для знакомства с системой можно посмотреть статическую демонстрацию на сайте или проверить её работу в режиме тестирования, предварительно запросив код доступа.



Сразу хочется отметить похвальный дизайн и отличное юзабилити. В них нет ни чего излишнего, не функционального или отвлекающего внимание от заявленных целей. Особенно приятно использование к месту простейшей анимации. Так как заявлен «непрерывный мониторинг», слева от каждого контролируемого документа есть пиктограмма «Увеличительное стекло», которое непрерывно движется, создавая благоприятную иллюзию непрерывной работы системы и участия в этой работе автора — круговое движение «увеличилки» можно остановить и начать снова нажав на соответствующие кнопки рядом с документом.



Загрузка производиться просто. Документ принимается «так, как есть». Единственное требование — это нормализация, поскольку не поддерживаются ни проприентарные, ни открытые форматы и принимается всего лишь один формат — текстовый. Нет ни каких реализаций API, нет закачки, нет возможности загрузки почтовых вложений. Плоский текст при помощи простейшего «копи-паста» вставляется в текстовое поле формы; заполняются два служебных поля: «URL» и «Заголовок», которые несут исключительно технический характер -«привязывание» документа к определённому источнику и заголовок навигации пользователя по списку загруженных документов. Система маркирует принятый документ единственной меткой — дата и время депонирования.

Вот, пожалуй и всё.

Такой подход может показаться удобной только в том случае, если пользователь отслеживает небольшое количество документов. Если речь идёт о десятках, сотнях или тысячах, это способ уже не кажется привлекательным.

И в этом кроются, как минимум, две проблемы. Будет ли этот процесс «депонированием», которое обещано разработчиками в качестве инструмента фиксации приоритета? Не надо быть семи пядей во лбу, чтобы понять, что такое депонирование имеет юридическую силу предъявленного Швондером ордера домкома. Если у автора нет возможности разобраться «по понятиям», то метка в системе CopyGuard не имеет ни какого законного приоритета фиксации авторства — даже на фоне таких «призрачных» инструментов, как как «Копирайт» или новомодный «КреативКомон». Может быть в дальнейшем владельцам системы удастся получить признанный статус «провайдера депонирования», но пока этого нет.

К тому же странно видеть корпоративный или персональный сервис фиксации права собственности без обеспечения соответствующих высокому статусу протоколов защиты, шифрования и имеющей законную силу электронной подписи. Я бы не рекомендовал пока ни кому говорить, под страхом наказания, что это «депонирование». А уж, тем паче, брать или платить за это деньги, поскольку действительно фиксировать копирайт пока придётся традиционными способами: депонированием в уполномоченных офф-лайновых организациях или путём «зацикленных» почтовых отправлений: через почтовое отделение с окошками, почтовыми марками и чернильными штемпелями.

Фишки

В тестовом режиме система допускает загрузку для мониторинга всего лишь пяти документов. Поэтому я внимательно подошёл к отбору «фишек» и постарался подобрать оригинальные документы из числа своих работ. Требования к отбору были примерно такие:

- авторский текст документов; — документы имеют различную дату публикации в сети и доступны для поисковых машин по широкому спектру запросов; — имеют разный жанр; — не содержат существенных таблиц, графиков и иллюстраций; — часть документов должна быть или полностью, или целиком гарантированно воспроизведена в русскоязычном сегменте сети; — по части документов должны быть отзывы от читавших их он-лайн людей.

Выбор пал на:

«Очарование насилием». Оригинальный текст, который время от времени находится по поисковым запросам связанным с рекламой, социологией, порнографией и эротикой.

«Как бы событие которого как бы не было». Текст имел своих читателей, поскольку персонально относился к ним и к их профессиональной группе. Кроме того, он имел отзывы и затронул пользователей «профессионально» увлекающихся флеймом в интернет. Он является псевдотеоретичским и околорекламным текстом, позиционированным как некоторая рекламная публицистика. Самый старый из выбранных текстов.

«Синдром Курниковой». Оригинальный текст, с самым большим объёмом из выбранных. Содержит несколько ссылок, цитату без ссылки, но маркированную формальным копирайтом и много текста, связанного с различными технологическими аспектами: телевидением, масс-медиа, ядерной физикой, интернет. Кроме прямого цитирования в нем есть глубокая компиляция нескольких текстов технического характера без указания источников.

«Тезисы для конференции». Оригинальный текст, который не так давно опубликован на сайте международного форума как на русском, так и на английском языке.

«Информационная записка». Выбрана исключительно потому, что язык и структура используемые в нем являеются типовыми, очень ограниченным в применении и образуют можество устойчивых языковых конструкций, которые непременно должны создавать в интернет поисковой шум от большого числа текстов построенных по подобной схеме.

Игра на глобальной доске

Тексты выбраны и загружены. CG сразу начал поиск нарушений.

Хотя такая возможность предусмотрена я не стал включать доставку отчёта по электронной почте так как не собирался дергаться по поводу каждого письма. Тем более, что на сайте нет явного описания процедуры доставки — по каждому факту покушения отдельно или периодически, по всем обнаруженным за период злонамеренным действиям. Рядом с опцией не было ни каких настроек параметров доставки и я решил не тестировать этот сервис.



Кроме отправки по электронной почте есть возможность забирать RSS-фидер или получать его по почте через сервис rss2email.ru, где надо указать адрес транслируемой ленты мониторинга, почтовый адрес доставки, получить реквизиты для управления сервисом и подтвердить регистрацию. И тут тоже не всё понятно: то ли каждый документ имеет свою отдельную ленту, то ли все документы будут консолидироваться в одну ленту. Ни каких указаний на CG нет, но возможно они появятся позже. Пока это определилось по присланными письмам: каждый документ имеет свой парсер, который консолидируется на уровне сервиса rss2email, через который можно управлять подписками, что тоже не очень удобно. Если сразу не настроить этот сервис, то через некоторое время в почте обнаружиться письмо с «рекомендованными к подписке RSS», что для некоторых может стать дополнительным поводом для раздражения. К тому же лента нарушений из системы частного мониторинга попадает на открытый сервис, защитить и контролировать который не представляется ни какой возможности.

Первые результаты появились через четыре-шесть часов после депонирования документов. Как подозрительные отмечены два текста: «Синдром Курниковой» и «Информационная записка». Система выдала только один тип результатов — цитирование без ссылки на первоисточник и с указанием на него. В первом случает она за первые сутки нашла 64 цитаты и добавляла по 2 каждые 12 часов, во втором — 4. Напротив каждого из них появился странный маркер «нарушение обнаружено 31.12. 1899 00:00:00»

«В слепую»

В результате через двое суток было найдено 98 цитат на 68 сайтах текста из «Синдрома „Курниковой“ (через три недели — 116 цитат на 76 сайтах) и 6 цитат на 4 сайтах из „Информационной записки“.



Не смотря на бешено мечущуюся пиктограмму увеличительного стекла напротив каждого из депонированных документов, в течении последующих пяти суток не добавилось ни одного нового факта „нарушения“.

Если в случае со вторым документом у меня были сомнения, то количество цитат из первого документа сразу вызвало недоумение.

Для проверки своих подозрений я воспользовался расширенным поиском Google, ограничив его только документами HTML-формата. Был загружена довольно обширная цитата и в результате получено 16 цитат на 4 серверах. У Яндекса 186/99 соответственно. Разночтение был списано на ограниченность демонстрационного входа CG.

Увы, дальше нет ни какой возможности управлять процессом, кроме как исследовать всё что „нарыла“ система вручную, после чего можно поместить обработанное в один из трёх разделов: „Нарушители“, „Одобренные перепечатки“, „Удаленные“.





Обработка результатов — на редкость трудоёмкий и ни как не автоматизированный процесс. CG зафиксировала всё цитаты в виде списка ссылок, а дальше надо открывать их в браузере и проверять отдельно каждый подозрительный факт.

Тут меня ждало жесточайшее разочарование: среди найденного не оказалось ни одного заимствования оригинального текста — все нарушения касались исключительно эпиграфа. Но мало того, некоторые заимствования были отмечены как „цитаты со ссылкой на первоисточник“. Возник вопрос: „Что система считает первоисточником“? Ответ был получен быстро: „Ничего“. Именно „ничего“, поскольку в части маркированных таким образом текстов не было обнаружено вообще ни каких явных ссылок, а в части — ссылки куда угодно, но только не на депонированный текст или, в крайнем случае, на произведения цитируемого автора. Тем паче, что у него нет ни какого сайта, который мог бы считаться „официальным“.



На системе можно бы было поставить крест, если бы не результаты обработки второго документа. Обнаруженные цитаты без ссылки на первоисточник и находились на специфических сайтах: Сайте и сайте . Цитат было всего четыре и по этому проверка не заняла много времени. В качестве цитат были указаны копии одного итого же документа: Научно-технологического парка в Новосибирском Академгородке.

С одной стороны — в этом не было ни чего удивительного, поскольку я тоже участвовал в подготовке его концепции, технико-экономического обоснования и ещё ряда документов. С другой стороны — просто беглое сличение не давало ни каких явнях результатов.

Пришлось провести сравнение проверенным на больших проектах способом: загрузить их в K3Diff и посмотреть, действительно ли тексты до такой степени не оригинальны. Среди мусора совпадений, который укладывается в простую статистическую погрешность



обнаружилось совпадение в трёх строках сравниваемых документов,







что можно считать неплохим, но уж слишком „шумным“ результатом для системы, которая предназначена для поиска нарушений копирайта.

Выжить за счёт параноиков

Ценность подобного сервиса заключена в непрерывном мониторинге образов депонированных документов. Что до заявленных целей — то я не нашёл в ней ни чего такого, чтобы позволило говорить о CG как о некоем эпохальном шаге по направлению к тотальной защите копирайта в интернет. Какой толк от непрерывного мониторинга, если для придания ему законности необходимо провести офф-лайновое депонирование, его результаты надо разгребать вручную, а система хороша ровно настолько, насколько хорош закон об авторских правах — и не более того. И если наглядно представить эволюцию CG до тестируемой сейчас функциональности, то это будет последовательное изобретение скрепки, пластиковой папки и многоярусной настольной подставки с лоточками „Входящие/Исходящие/На визировании“.

Для владельца системы всё её дальнейшее существования упирается в стоимость трафика. Но пока нет оферты сервиса для конечного пользователя — не стоит ломать копья как и откуда берут базу для мониторинга. Тем не менее, для такой системы это будет критическим фактором который будет влиять на количество пользователей.

Понятно, что в представленном для тестирования виде этот сервис не очень интересен корпоративным пользователям с большими объёмами материала. Сервис не функционален и требует трудоёмкой ручной обработки данных. Остаются только маленькие издательства, специализирующиеся на выпуске небольшого количества наименований. Но тут опять возникает проблема: CG провела мониторинг только в одном формате — HTML или его парсинговых вариантах, и ни как не проявила себя в поиске документов в „форматах дистрибуции“ — электронных книг, архивов, торрентов и тому подобного.

Я бы даже чётко описал целевую аудиторию CG как весьма ограниченных в средствах маниакальных приверженцев копирайта, для которых решающим фактором будет стоимость услуги, а не её функциональность и качество.

Бросая камушки в воду

Тем не менее, я бы не стал так просто ставить крест на сервисе. Он достоин внимания хотя бы потому, что несет в себе несколько рациональных зёрен, которые можно использовать для других, более коммерческих и востребованных целей. Но для этого CG надо совершенствовать и дополнять функциями, которые остались „за обрезом“: увеличить „пропускную способность“ модуля депонирования; предложить систему настраиваемых шаблонов; обеспечить юридическую силу факта депонирования; оказывать услуги третейского судьи в разрешении конфликтов; автоматизировать разбор случаев нарушений и т. д.

А пока CG не приобретёт эту дополнительную функциональность он будет интересен только
как занятный бесплатный сервис.

о копирайте:

Creative Commons License
This work is licensed under a  Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
Популярное