Контентът – горивото на модерната SEO стратегия
Дидо Григоров започва да се занимава с програмиране през вече далечната 2001 година, когато създава и първите си сайтове на тогавашните версии на HTML & CSS. По-късно, през 2003та, започват и първите му интереси към оптимизация за търсачки. През 2005та започват и тестовете в оптимизацията със собствени сайтове, а година по-късно и първите малки стъпки на работа с клиенти. През 2007ма година Дидо започва да следи редовно блоговете на SEO специалистите по света, както и първите по-големи сайтове, които дискутират теми свързани с оптимизация на сайтове. Проявява се и интересът му към технологиите на търсачките и семантичното търсене: Information Retrieval, Natural language processing, Ranking systems. Дидо е първият SEO специалист от България, участвал с презентация на събитие на Google – Google Dance Zurich на 21.09.2018 в офиса на компанията в Цюрих, Швейцария.
Guest
Дидо Григоров
SerpactHost
Борислав Арапчев - SEO Strategist в агенция Serpact
Serpact
The webinar starts in:
Webinar agendas
Контент стратегията - какво представлява?
Алгоритмите за оценка на релевантност на съдържание
Ранкинг алгоритмите
Задайте вашият въпрос към Дидо на живо
В уебинара ни, провел се на 27-ми септември 2019, ние от Serpact разговаряме с Дидо Григоров.
Темата на дискусията ни е: Стратегия за съдържание – горивото на модерната SEO стратегия с Дидо Григоров.
Преминаваме към въпросите:
Борислав Арапчев: Здравейте и добре дошли на нашия нов уебинар. Сегашният ни гост е много интересен, той реално е и мой колега в агенция Serpact.
Решихме да поканим точно него на днешния уебинар, защото това, с което той се занимава и специализира, в момента е много актуално. Излязоха доста новости от Гугъл по обявената тема за контента в един сайт и тясно свързаните с нея теми за алгоритъма на Гугъл – по-точно за някои параметри на Гугъл при класирането и оценката на вашия сайт – все теми, които винаги ще ни вълнуват…
Сега ще ви го представя – това е Дидо Григоров. Здравей, Дидо…
Дидо Григоров: Здравейте, много ми е приятно…
Борислав Арапчев: Нека първо да те представя накратко, а после ще ти дам думата…
Своите първи сайтове Дидо Григоров създава през 2001 година на езика HTML както го правеха и много от нас.
През 2003 г. начеват и първите му интереси към оптимизация за търсачките, през 2005 започва и тества със свои сайтове, а по-късно и със сайтове на клиенти.
В 2007 г. Дидо започва да следи блогове на световно известни специалисти, които дискутират различни теми в областта на оптимизация за търсачки.
Днес Дидо е първият SEO специалист в България, който участва с презентация на официално събитие на Гугъл – Гугъл Dance през 2018 г. в Цюрих, Швейцария, което е голям повод за гордост на всички български специалисти. Той има интерес към технологиите и по-специално се профилира към Information Retrieval, Natural Language Processing, Ranking Algo и други подобни сложнотии… 🙂 …
Дидо Григоров: … 🙂 …
Борислав Арапчев: Както винаги първият ми въпрос към всеки наш гост е личен – кажи ни как навлезе ти в областта на дигиталния маркетинг, как започна твоята кариера?
Дидо Григоров: Здравейте и благодаря много за поканата да участвам в този уебинар. Усещам, че днес ще се получи много интересен диалог…
Борислав Арапчев: …много интересен … 🙂
Дидо Григоров: …защото все пак сме колеги и така се получава една интригуваща симбиоза на обмяна на опит…
Ами как навлязох в тази област ли?… Как?… Много назад ме връщаш, Боби…Честно казано, това е времето когато аз започнах още като дете да използвам компютъра… Още през 1998 година, беше по времето на далечния уиндоус 98…
Гугъл като цяло го познавам от 2000 година… Запалих се и започнах да пиша на HTML , отчасти CSS – тогава CSS-а беше бедна работа като цяло … благодарение на Microsoft Front Page – (едно приложение, което вече го няма, Майкрософт отдавна го спряха) … за създаване на уеб сайтове… Бяха много базови, нямаше динамичности в него, нямаше този сложен JavaScript, който имаме в момента на много нива, нямаше PHP и Python…
Всъщност идеята дойде от един мой много близък приятел, който бе софтуерен инженер, той ме подбуди към идеята за класиране на сайтове и тогава това беше много лесно, защото Гугъл не използваха семантика, нямаше семантични модели за оценка на самото съдържание, на фрази, на класиране на абсолютно нищо… Всъщност техните първи опити са от края на 2006, 2007-2008 г., но преди те нямаха този фокус върху това… Класирането тогава беше изключително лесно, в смисъл информейшън ретривъла като информейшън ретривъл е доста сложен като материя, като основа, но същевременно не е толкова усложнен както съвременните machine learning алгоритми, които в момента Гугъл използва за тази цел и затова тогава оптимизацията беше лесна. Единственото сложно и неразбираемо нещо и обект на голямо тестване и на голяма тайна тогава беше PR-а, защото нито Лари Пейч, нито Сергей Брин скриваха някакви трикове около него и общо взето това беше малко „биг сикрет“, нещо, което да гали твоето любопитство и да се чудиш какво да направиш за да сработи. Всъщност то беше много просто дори и тогава – колкото повече линкове имаш и особено пък ако успееш да имаш линк поне един на авторитетен източник, значи ти си наистина топ авторитет, без значение какво пишеш и колко пишеш… Тогава нямаше значение нито дължината на съдържанието, можеше да си повтаряме ключови думи безброй пъти, даже то си беше приоритет това… И ти, Боби, си спомняш тия години, така че…ясно ти е…
От 2007 година тръгнаха промените, много повече хора започнаха да пишат за SEO, започнаха да се появяват повечко журнали – в 2005/6/7 г. това са Search Engine Journal, Search Engine Land и т. н. … те не изглеждаха така в тоя вид както в момента, бяха много прости и базови – и общо взето, кой каквото научеше, пишеше и споделяше там, за да има информация и да се създава някаква камюнити, (някаква общност) в Интернет по SEO. Бил Славски беше тогава един от хората, които, така, ме вдъхновиха (то неговия блог е от 2006) да почна да ровя там, където другите хора масово пропускат да ровят, защото реално по-лесно им идва да виждат и получават информацията наготово от журналите, но моят интерес след 2007 г. започна да се фокусира върху технологията на търсачките – т. е. как те работят, основата им – аз съм се занимавал няколко години с Python програмиране и общо взето имам доста голяма представа за това каква е механиката на една търсачка отзад – как индексира, как кролва, как рендира и т. н. Просто самите тези чисто функционални (неща) ги познавам доста добре… та включително и на начина на анализ на фрази, на свързване с документи и т. н. наистина труден и сложен процес към днешно време, но… оттам тръгнах… 2007 е преломната година, основата на това, което почнах да търся…, двигателят! – какво стои зад гръбнака на една търсачка и защо това, което тя прави го прави! Това е интересно, това е моят интерес!
Защо дадени документи са класирани по този начин – това за мен не са резултати, вие поне ме познавате… – за мен това не са резултати, това за мен са документи, корпус от документи, който се класира по определени сигнали и фючъри…
Първите инспиратори след моя приятел са Бил Славски и Ранд Фишкин – Ранд всички го знаете, той наистина е един от първите…
Борислав Арапчев: Бил е много добър. Той е анализирал много патенти на Гугъл, където там има просто съкровища, но трябва много да се чете и проучва издълбоко…
Но преди да ти задам много важния въпрос за съдържанието (за контента), мисля, че ще се съгласиш с мене, че дълги години стълбовете на SEO бяха линковете и съдържанието… Предполагам, че Гугъл са разбрали, че линковете са доста лесно и добре манипулируеми и съдържанието е взело превес като по-стойностно и качествено върху което си заслужава да се работи, докато ролята на линковете намалява и това го виждаме във всекидневната си работа…
Дидо Григоров: Абсолютно! Не е случайна причината, поради която в една от последните си статии в Центъра на знанието на нашия уебсайт Serpact.bg, вмъкнах два много важни факта за пейч ранка – това, че пейч ранка не е вече това, което беше и няма нищо общо със стария му вариант…Ние си контактуваме постоянно с инженери на Гугъл (няма защо да го крием този факт) и те много пъти са ни казвали, че всъщност, реално погледнато, самата формула е вече променена, самите параметри вече са други, по съвсем друг начин вече калкулира … Той вече е КОНТЕКСТУАЛЕН пейч ранк, а не оня, който беше…
Борислав Арапчев: …той стария (пейч ранк) изцяло на линкове беше базиран и затова сега просто същността му е изменена …
Дидо Григоров: …да, в литературата за Natural Language Processing го наричат топикъл, „топикъл сенситив пейч ранк“ е понятието, а другото (понятие) е „фрейс сенситив пейч ранк“, т. е. тема срещу фраза или документ с тема срещу фраза – така се оценява, а не както в стария вариант, където имаш N на брой линкове с N на брой някакви там домейна с дадена метрика.
Преди много по-лесния вариант беше просто да си видиш, да си сметнеш сайтовете и като си направиш, примерно, една бройка такива сайтове, ясно е, че ще бъдеш класиран. Сега към днешно време това не е сигурно! Няма никаква гаранция, че това ще се случи точно така… Самите класификатори, самите характеристики, които Гугъл следи, са много повече, отколкото преди. Преди ако са били само числа, сега са много повече неща. Отзад стоят много други неща…
Борислав Арапчев: Да, добре. Да те попитам нещо, което интересува всички и за което всички гледат сега – за контент стратегията, или за стратегията на съдържанието – защо е важна тя, какво представлява и как я правим? Това са, може би, най-важните въпроси по нея, които можем да зададем към теб…
Дидо Григоров: Аз обичам да разбивам нещата на подзадачи… Да започнем от там „какво е стратегия?“
Контент стратегията, или стратегията на съдържанието…
Голяма част от хората бъркат контент стратегията с това просто да пишем нещо. За мен най добрата контент стратегия е тази, която взаимодейства перфектно с аудиторията. (Аз съм давал много пъти това определение на различни конференции и по различни поводи.) Ако съдържанието взаимодейства перфектно с аудиторията, то неминуемо ще работи с Гугъл…, стига, разбира се, да не е чисто иновативно… да, тогава може би ще бъде класирано от Гугъл, но пък няма да има достатъчно аудитория… но в същия момент пък тази (другата аудитория), когато го представяш на нея, то (съдържанието) да резонира с нея…
Много е важно съдържанието да резонира, да може да движи клиента през customer journey, т.е. през определените страници да се изпълнят определени микро и макро цели и най-накрая вече да е изпълнена финалната главна цел, която в случая е да реализираме продажба или пък да привлечем някакво запитване…
Борислав Арапчев: …абонамент за бюлетин или пък нещо друго, което целим…
Дидо Григоров: Не можем да кажем точно кои са генералните, общите цели на един сайт. Хората са толкова креативни, че измислят един милион неща и общо взето, няма как да знаеш какво точно е заложено, за да се генерализира…
Защо е важна по друг критерий стратегията? Защото именно това е пълнежът. След основите, стените на една къща са точно съдържанието. Ако го нямате съдържанието, представете си колко постно би изглеждал един уеб сайт или пък ако си пишем хаотично в него, без да знаем какво се случва от другата страна на потребителя (клиента), дали потенциалния резонира с това съдържание или не, доколко и как и общо взето казано, това едно стреляне на сляпо, както обичам да го наричам аз…
Та какъв ти беше следващия въпрос? …
Борислав Арапчев: Ами въпросите са все около контент стратегията… Например, как правим контент стратегията? Ти си споменал за така наречения мапинг, т. е. ако имаме един магазин за дрехи, трябва да имаме категории за чанти, за обувки, за палта и т. н.
Дидо Григоров: Правенето на една стратегия е много индивидуално нещо… Индивидуално е защото всеки бизнес е различен. ДА! Може би самите ниши са едни и същи и са ни до болка познати колкото и да се измислят различни ниши! Попадал съм на бизнес списъци на ниши от цял свят – по принцип бизнес нишите са над хиляда, ако трябва да ги смятаме реално и да ги гледаме… А, може би, са станали и над две хиляди вече – гледал съм ги преди доста време… Но баналните ниши, които познаваме, са горе-долу едни и същи…
Истината е, обаче, че стратегията се прави индивидуално, (т. е. колкото и един бизнес да е в дадена ниша, той е уникален сам по себе си и като бранд, и като стил на говорене на аудиторията си, и като поведение, и като тематика, че дори и като асортимент, ако е он лайн магазин в случая…) минаваме през няколко етапа. Винаги се започва с research и дефинирането на buyer persona (това е много важно, защото, реално погледнато, това е горивото на контент стратегията). Грешно е да си хванеш списък от ключови думи и да си пишеш неща само защото си има някакъв обем от търсене. Може това да не кореспондира с твоя бизнес изобщо… Това, което всъщност ще направиш е да си вдигнеш Bounce rate на уеб сайта и… дотам! Няма да си изпълниш крайните цели да можеш да продаваш чрез твоя уебсайт.
Обратният вариант, (познавайки, знаейки и вече събирайки информация, – много пъти сме го казвали това вече) ако се налага, хубаво е да си купиш маркетингово проучване, хубаво е да си поръчаш такова и съответно да си го заплатиш – това помага многократно и за контент стратегията – т. е. там вече имаш една богата информация, в дадената ниша кои са общите buyer personas. Хубаво е да си прегледаш, да имаш някаква базова информация за баер персоните на твоя бизнес, т. е. какви по-интересни профили от хора влизат като потенциални клиенти, кои са склонни да купуват и кои не са склонни… и, респективно, с това е хубаво (лично аз бих препоръчал да има такава информация от ден първи от създаването на бизнеса да имаме профили в социалните мрежи, защото там става най-бързо.) Не че няма вариант, с който да ги проучваш, вече има хиляди софтуери за data analysis и т. н., но в социалната мрежа имаш визуална представа за човека, какъв е като профил – чисто като социален статус, като професионален статус и т. н., а това неминуемо изключително много помага.
Също и обратната връзка – дори първоначалната е много важна и също много помага… и това от data ресърча вече създава базата за изграждането на още един документ, който е тъй наречения мапинг, за който вече спомена Боби… този мапинг го разделяме на типове страници, разделяме го на това какви цели ще имаме с тези страници, как ще видим потребителя по стъпките на customer journey, какво ще постигнем и какви ни са макро конверсиите, кои са ни микро конверсиите, т.е. ако е дадена макро конверсия и ще я изпълняваме, тя как ще ни помогне за микро към макро конверсията си и т. н. Респективно, тук вече влизат и фразите, които ще бъдат мапнати на съответната страница, на свързаните към тях фрази, че даже и заглавията и описанията, тъй като все повече ни прави впечатление и сте забелязали всички, че заглавията са нещо много важно и Гугъл ги отчита също… А и неписана истина е, (Нилсън са го доказали в Щатите многократно) че заглавието изключително много влияе върху потребителя и върху това дали той е склонен да прочете нещо или не, т. е. това е първото привличащо нещо… Ако го няма то както трябва, няма защо да четем другия материал по-нататък…
Съвсем скоро, преди около месец и половина, имахме с Педро Диас един уебинар, в който той каза, че информационната архитектура е нещо много важно и оттук следва да се спомене, че тази информационна архитектура или структура на самия уеб сайт (да започнем оттук, но не трябва да бъркаме информационната архитектура с навигацията – това са две различни неща! – навигацията е част от нея, но информационната архитектура сама по себе си е нещо доста по-различно и не се спира и завършва само с навигацията на един уеб сайт). Информационната архитектура е важна под форма на форматиране на съдържание – на разпределение на страници, на групиране на страници, категоризиране… Дори ако използваме и тагове, това също е част от самата информационна архитектура…
За навигацията, казахме вече… тя не винаги е свързана сто процента със самите страници. Не всяка страница е видима, не всяка страница можем да я поставим там, защото ако си представим един сайт от милиони страници, няма как да ги тикнем всичките в навигацията – невъзможно е! – поради това имаме и категоризация, заради това имаме и тагинг, имаме и обобщение по определени теми, сайтовете също все повече използват и филтрации – това също е информационна архитектура – форматирането също, разпределението на самите абзаци, на теми и подтеми и т. н. (След малко за това ще си поговорим повече…)
Другият документ, който влиза в една контент стратегия е блог календара. Това е нещо, което много хора го пропускат, много бизнеси правят този пропуск, включвам тук дори и големи компании, които се движат съвсем хаотично и пропускат тази златна възможност да си имат нещата черно на бяло, да си добавят колони в съответния документ, като препоръчително е хубаво да се ползва Excel или Google Spreadsheets, или там каквото използват за таблици… с ясната идея, че виждайки го пред теб, виждайки кой е автора, кои са темите, кои са подтемите на един блог, каква да бъде дължината, къде да го промотираш този пост, даже в един момент какви са му и метриките… Освен метриките като трафик, като конверсии, да виждаш смисъл в ефективността на една тема – това ти помага изключително много след известно време, защото виждаш реално какъв тип теми… така или иначе един блог календар никога не се създава само заради определени теми, които трябва да бъдат писани… той е категоризиран този блог план! В него имаме определени теми, определени типове артикъли (имам предвид определени типове статии), които могат да бъдат, примерно, списъчни статии, могат да са интервюта, могат да са информационни статии, могат да са по-образователни и дори научни статии в някои сфери, могат да са така наречените term статии, където се обясняват някакви понятия, трендови статии могат да бъдат, нюз (новинарски) статии могат да са… Просто блог календара ти помага, следейки цялата тази информация плюс метриките за успех по отношение на Bounce rate, Time on page, Assisted conversions – тоест доколко даден блог е помогнал за реализацията на някоя конверсия, това нещо ни помага, примерно, накъде да си насочим календара за следващата една година, учим се в движение, както се казва и вече ни е ясно, че всеки следващ блог календар ще става все по-добър…
Борислав Арапчев: …т.е. контентът трябва да е максимално гъвкав и адаптивен, предвид интереса на аудиторията и самата ниша, самия бизнес накъде върви, защото тя търпи развитие – това много хубаво го обясни и беше полезно… Но аз искам да те върна леко и да обясним за баер персоната с две изречения, защото не на всички е много ясно…
Например, ако имаме два бизнеса и единия работи в университетската сфера, а другия – с авточасти, т. е. клиентите му са автомонтьори предимно, ние трябва ли да говорим на два различни езика – при университетския – на високо ниво, а при този за авточастите и автомонтьорите – на по-разбираем език, съобразно клиента или потребителя?
Дидо Григоров: Именно…именно… По принцип, баер персоните на тези бизнеси трябва да бъдат разгледани внимателно, но и чисто през призмата на съответните бизнеси като брандове, защото … да, има някаква обща информация… маркетинговите проучвания, които правят компаниите, са много полезни и наистина си заслужават плащанията, които те изискват. Но все пак няма как да генерализираме факта, че точно същите баер персони ще дойдат при нашия бизнес. Винаги ще има малки, дори и минимални разлики, които е хубаво да бъдат взети под внимание, защото точно там дяволът е в детайлите, точно там, понякога, е разковничето за конверсия…
Оттам вече е важно да се обърне внимание на стила на писане, както ти спомена, че даже на темите, които ще се подбират, дори и преди класификацията им… Голям проблем е понякога, че дадени теми не се разбират от дадена аудитория, респективно, вдигаме bounce rate на уебсайта…
Борислав Арапчев: …да, да… това е много ценно, защото, както каза ти, правим си теми, почваме да пишем, но копирайтъра трябва да се съобрази с отсрещната страна, която ще ги чете.
Дидо Григоров: Тука има нещо, което искам да вмъкна. По принцип, човек ако няма чувствителност към езика, стилистична, лексикална и т. н., много трудно би могъл да направи една такава успешна стратегия. И сега ще го обясня защо – семантиката е много тънко, много фино нещо. Както има една българска поговорка „казвам ти, дъще, – сещай се, снахо!“, това е и принципът на контент стратегията, ако трябва да го побългарим по този начин и да го обясним на наш, роден език, където често пъти едно се казва, а се разбира и подразбира друго и често едно нещо трябва да бъде заменено с друго нещо поради ред причини – бранд, NDA … т. е. трябва да предадем съдържанието по един начин, но все пак по различен начин, така че да не разкриваме напълно ноу хау… отделно езикът ни е много богат, особеното в българския е, че едно нещо може да бъде казано по изключително много различни начини… Не че в другите езици това не е така, но нека да кажем, че нашия език е с една идея по-богат! …
Борислав Арапчев: Срещал ли си това, че Вазов в произведенията си е използвал петдесет хиляди думи, докато Шекспир – двадесет хиляди? Тези анализи, според мен са абсолютно реални, тъй като имаме страхотно богатство и страхотна палитра от думи…
Дидо Григоров: Да…
Много внимателно и добре трябва да се познават характеристиките на самите баер персони, за да знаеш точно и чисто сензитивно да разбереш кои теми биха били важни и интересни за тях. Наистина, много е тънка границата на подбор и много лесно е да се подхлъзнеш и паднеш…
Борислав Арапчев: Добре…Дидо, има много голям интерес към днешния уебинар, вече 30 души ни гледат на живо, почти гоним първия ни уебинар, който беше с Джон Мюлер… Този интерес, според мен, е логичен, защото темата е много интересна и важна. Но аз искам да направя една изненада – да вмъкна един въпрос, който не е планиран и мисля, че ще бъде интересен за нашата аудитория в момента – кажи ни как се почувства ти, презентирайки и говорейки пред инженерите от Гугъл?
Пред Джон и Гари, и пред всички там – все хора, които отговарят за качеството на търсенето, shopping quality raters и т.н. Сещаш се, става дума за това, когато бяхме в Цюрих заедно… да, там ние бяхме заедно, но какво ще ни кажеш ти за това, за твоите преживявания, емоции и пр., това все пак си е нещо специално…
Дидо Григоров: (въздъхва дълбоко) Не мисля, че има дума, с която може да се опише това усещане, особено като имаш предвид какви хора са пред теб и IQ-то им какво е, защото на всички е ясно с какво високо IQ са хората, работещи в Гугъл. Те са специално селектирани хора и не всеки има възможност да бъде там… Съответно, това са обучени хора, които познават добре биоалгоритмите и софтуер инженеринга като цяло…
Вълнуващо и отговорно, ако може така да се опише… Но повече отговорно, защото там нямаш право на грешки! Ако искаш действително да се представиш добре и да оставиш едно добро впечатление, наистина нямаш право на грешки! Да не говорим за езикови грешки – говорим за презентационни грешки… ясно е, че можеш да допуснеш някоя и друга езикова грешка, понеже не си някакъв нейтив спийкър, а и на тях им е пределно ясно, че от вълнение човек може да греши, въпреки, че говори нормално през другото време… А то, вълнението, си беше голямо, пък и там от инженерите не бяха само Джон и Гари, а бяха цял списък инженери от Гугъл Search Console, както и от други продукти на Гугъл… И когато си в една такава зала и точката от светлината на прожекторите е върху тебе…
Борислав Арапчев: Аз знаеш ли за какво си мислех когато подготвях тук темите за уебинара? Представих си, че Джон и Гари гледат твоята презентация и виждат как ти им показваш, че нещата, за които те самите съветват уебмастерите и SEO специалистите, работят добре. Ти им показваш, че когато тези неща се изпълнят като правилна архитектура, информация и съдържание, отговарящо на нуждите на потребителя, това всичкото работи много добре и връща като решение един красив, подреден сайт, който е удобен, полезен, има много добри резултати и много голям ръст…
Дидо Григоров: … точно така…
Борислав Арапчев: …и това е страхотно… Според мен, те са били щастливи, защото ти им показа, как това, което те проповядват, щом се реализира, се връща като един много добър резултат… били са щастливи да се уверят в добрите плодове на своя труд……това имах да кажа…
Дидо Григоров: …да … да … абсолютно е така! Трудно ни е и няма как ние да споделяме сега директно много информация за това събитие, защото знае се, че реално се намираме под декларацията за поверителност, но отзивите, които чухме след самото събитие и към мен, и към теб, Боби, и към Ники, всичките бяха повече от хубави, особено думите на Джон и Гари… лично на мен Гари дойде и ми каза „It is amazing“ за самата презентация…
Към онзи момент в самия Гугъл на неговия сайт споделяха съдържание за информационната структура и колко е важна тя като цяло, дори в блога им се споделяше такава информация, те дискутираха много, във форумите и абсолютно навсякъде имаше доста много информация… Беше тренд (тенденция)! И самата тема към този момент също влезе в този тренд (в тази насока на развитие)… и, как да го кажа, в този случай стана така „да бъдеш на точното място с точните хора в точното време…“
Борислав Арапчев: Да, вече има и първи въпрос, ще има и други…Един от нашите колеги – Pshemislav Kaspshik пита: може ли да share-нете примерен mapping документ?
Дидо Григоров: Може да се направи един такъв демо документ, който да се разгледа като цяло какво представлява, но бих искал тук нещо да споделя – не може да се използва като тенденция в никакъв случай. Когато ги правим стратегиите при нас, всичко се прави индивидуално и тези документи търпят големи промени понякога… Даже в някои случаи, примерно, ако имат 20-25 колони, в тях се запазват едва 5, останалите се променят…
Борислав Арапчев: Всичко е на база индивидуалността на бизнеса, както ти каза …
Дидо Григоров: Ами да! Ние, по принцип, (ти знаеш, Боби) когато започваме работа с клиенти, имаме много дълги разговори по въпросници към всеки от тях. Винаги събираме максимално много информация, понякога дори от самите собственици на бизнеси и там от decision makers, от хората, които взимат решения, за да разберем максимално много детайли и специфики, които имат те като информация за всеки бизнес, защото нали все пак като собственик на бизнеса си се очаква да имаш информация за клиентите си…дори и малко да са… Въпросът е в това, че тия документи винаги търпят някаква промяна…
Борислав Арапчев: …значи можем да обобщим, че по-нататък можем да изпратим някакъв файл и да споделим някой он лайн адрес, където да погледнат за какво става въпрос. Минаваме към другата много важна тема, която със сигурност всички очакват да чуят твоите анализи по нея: де факто какви са алгоритмите за оценка на релевантност на дадено съдържание според Гугъл?
Дидо Григоров: Ох…
Борислав Арапчев: …това е много дълбока тема за часове…, но какво можем да обобщим?
Дидо Григоров: Мисля, да направим един осем часов уебинар за това нещо, който има желание да стои да го гледа… Така…
Аз ще наблегна сега на един от основните алгоритми, които Гугъл официално обявиха, че ползват – BERT алгоритъма, който в себе си е съчетание от други четири модела. Накратко ще обясня какво представляват тези модели.
ULMFIT е един специален класификационен модел за текстове. Той е, може би, най-усъвършенствания към момента модел, защото е единствения, който успява на базата на езиковия модел, languige модела, който се събира all over the web, т. е. изцяло от интернет. Гугъл има тази опция да го прави като кролва целия уеб – за него няма никакъв проблем да събира такъв тип данни и на базата на word embedings да обединява фрази на базата на определени характеристики и критерии и да ги векторизира…
Този точно модел използва точно това: на базата на language модела да направим класификация за темата на даден текст. Това е първото нещо, което включва въпросния BERT. То е една голяма мистерия, но всъщност на мен ми отне няколко дни да го разровя и да го обсъдим във фирмата и с екипа, за да го разберем като принципи на работа. Основата му е този текст – текста класификация, съобразена с езиковия модел… Какво е езиков модел?
Езиков модел е „всички думи, фрази и свързаните с тях фрази, които се използват в дадена тематика и в дадена ниша в случая.“
ELMO е малко по-различен модел. (Между другото също трудно беше намирането на абревиатурата ЕЛМО, приемаме, че са го кръстили на героя Елмо…) Всъщност това е най-сложния модел за контекстуализация на думи. Иначе казано, прави го на изключително, ИЗКЛЮЧИТЕЛНО дълбоко ниво, т. е. той си е чисто обикновена невронна мрежа, но работи bidirectional. Интересният момент тука е, че има определени характеристики, по които се прави изследването на тези думи. Това е дълбоко претрениране на невронна мрежа се нарича – претрениране, защото имаме отзад един речник, след това имаме и уеб и тези думи започват да се свързват и обединяват на базата на някакви определени характеристики, може да са морфологични, може да са други класификатори и т. н. (това също работи вътре в част от BERT).
Точно този модел (ELMO) работи и върху фразите, които пишем в Гугъл, т. е. той ги взима и ги изучава, а в същия момент другия модел ULMFIT, изследвайки language модела и определяйки класификацията на текста към определена тема, свързва тази фраза, която търсим през ЕЛМО, със съответния текст.
Ранкинг алгоритмите са нещо съвсем различно и там участват малко по-различни критерии за да се класира даден документ, но като цяло това са двата основни и най важни модела, които влизат в BERT. В BERT си имаме и трансформъра.
Трансформърът, всъщност е един подобрител, с artificial inteligence допълнени. Този модел работи зад самите ембединги, самата контекстуализация на думите. Изключително сложно е, тъй като всички невронни работят с тъй наречения LSTM модел или Long Short-Term Memory. Трансформърът е една определена база от запазване в памет, иначе по друг начин ще го дам с по-прост пример – трансформърът го увеличава това време, той добавя още едно допълнително време, той дава още един по-голям бек граунд, за да може тази памет да е по-разширена и съответно да имаме още по-дълбоко и пространствено изучаване на думите и свързването им чисто като контекст.
Обяснено по-просто, бърт може да се сравни с текстовете при обучението, примерно, на английски език, където се оставят празни места за попълване на съответните думи – BERT работи на много подобен принцип. Той знае какво има преди дадената дума и след дадената дума. И това го прави за почти всички думи в текста, т. е. на тази основа той може да направи една прогноза какво ще има в следващото изречение, в по-следващото изречение, респективно, в следващия параграф, в по-следващия параграф и така, имайки вече темата и тематичността на дадения текст, да го свърже с фразата, която търсим в Гугъл.
Доста назад на стената на Дани Съливан в Туитър, се дава един много добър пример по какъв начин работи BERT … (BERT е много различен от Rank Brain, не бива да се бърка с Rank Brain, ранк брейн има съвсем различни функции…) Тук имаме за цел да подобрим връзката между самите думи, за тези, които търсим, но и за фразите на чисто текстуално ниво… да се види вътре самия текст наистина ли отговаря на дадена тематика, наистина ли отговаря на дадена фраза и наистина ли отговаря на теми и подтеми, които са към зададената тема…
И още нещо много важно, което трябва да се знае: темата на един текст си я задавате от тайтъла на самия пейч, от H1 тага си в блог поста, в случая и страницата. Затова ние сме казвали и консултирали, че е много важно какво се пише там, освен тайтъла, който е в HTML, много е важно какво се пише там … това е първото нещо и критерий по който Гугъл и съответно BERT ще търсят. Подадено там, то по-надолу ще бъде сравнявано, проверявано, анализирано и т. н. което ако някъде по веригата се изложим, така много ще усложним процеса на анализ на Гугъл на самия текст. Това е една от причините, поради която Гугъл класира дадени текстове по-високо от други. Просто защото някой е забравил да форматира нещо или да си пренапише заглавието така, както би трябвало да бъде, т. е. да отговаря на темата… А най-голямата грешка е да пишеш едно и да има нещо съвсем различно в текста – тогава вече нещата стават… нали… може да се класираш временно, но много скоро това ще се промени…
Борислав Арапчев: Интересно и доста сложно, но нека обобщим. Значи алгоритъмът в движение се самообучава, саморазширява и приспособява към самите нагласи на аудиторията. И за да е в крак с нея подобрява самия начин на търсене и на вадене на резултати…
Дидо Григоров: Имаше много дискусии в мрежите относно това, че BERT е по-скоро статичен, понеже споделихме информация, че той използва основно Уикипедия като база… Да, вярно е, така е, използва я! Но, всъщност, това е основния модел, по който се претренира алгоритъма. Следващите тренировки, които получава, за да изведе резултат, идват точно от нас, от нашите уебсайтове, от нашето съдържание и от съдържанието на конкуренцията
Борислав Арапчев: Значи поведението на хората обучава алгоритъма и се получава един цикъл, един кръг, който става все по-добър…
Дидо Григоров: Да, това е съдържанието, което пишем…
Борислав Арапчев: Добре, ако някой попита: ето аз продавам дамски обувки, как трябва да ги опиша и представя добре, т. е. статията, която напиша да е релевантна на това, че да се класирам от Гугъл на първа страница.
Дидо Григоров: (смее се)
Борислав Арапчев: Какъв простичък отговор би му дал, макар че този прост отговор преди това изисква доста конкретни анализи.
Дидо Григоров: Да, така е, но не е тайна вече един прост постъпков модел, за който все повече се говори напоследък.
Практически, може би, първото, което трябва да се направи е: разгледайте си конкурентите в топ 10. Вижте какво са направили те и придайте допълнителна стойност. Ако те са писали за тези дамски обувки по пет критерия, вие направете десет.
Борислав Арапчев: Всъщност опираме пак до добавената стойност… Повече информация за клиента, задоволяваме нуждите му и печелим…
Дидо Григоров: Да, … и даваме повече информация на Гугъл…
Борислав Арапчев: Вече повече от 40 човека ни гледат, което е много силно…имаме и въпроси, но времето напредва…
Дидо Григоров: …нека да уважим публиката и въпросите….
Борислав Арапчев: Добре, другият въпрос е: Според теб, коя е най-добрата тема за стартираща страница за да е по-eфектен content-a? И има ли изобщо значение това?
Дидо Григоров: Нека да се дефинира понятието „стартираща страница“ – това началната страница на уебсайта ли е…
Борислав Арапчев: … и за мен това не стана ясно…
Дидо Григоров: …или е целева страница някаква? …
Борислав Арапчев: …според мен стартираща страница е, може би, нова страница, когато пускаме сайта днес…
Дидо Григоров: стартираща страница, когато пускаш сайта, не е определен критерий и не би трябвало да бъде никога…
Борислав Арапчев: …а-а-а, ето, уточниха, че става дума за началната страница…
Дидо Григоров: Аха… Началната страница е хубаво да бъде брандова, защото това е лицето на бизнеса, предполага се, че оттам започват потребителите… Но на всички ни е ясно, че не винаги те започват оттам, защото отдавна вече Гугъл не дава приоритет на хоум пейджовeте основно, макар че много хора още продължават да мислят в тази посока – не е вярно!.
Дори едни обикновени целеви страници могат да бъдат по-приоритетни за Гугъл и да бъдат класирани, тъй като са много по-търсени, по-посещавани от началната страница… имали сме толкова хиляди случаи вече…,може би, стотици от тях са били точно такива…, така че хоум пейджа, или началната страница е добре да бъде посветена на самия бранд и на компанията.
Ако трябва да търсим някаква универсална формула, то трябва да бъде, може би, представяне кои сме ние за бизнеса, какви услуги предлагаме, имаме ли някакви проекти към момента и някакви евентуални testimonials или отзиви, ако сме част от някакви организации, какви сертификати имаме и др. такива неща… Но това е много обща формула, много зависи какъв е бизнеса вече го казах, всеки бизнес и ниша са уникални! Особено бизнесите като брандове и даден бизнес може да е иноватор в нещо… Тогава ще покажем иновацията някъде на страницата.
Борислав Арапчев: Искам да те попитам и за ранкинг алгоритмите, защото много хора се интересуват от това. Как бихме обяснили преценката за качество, за стойност, между, примерно, на десет документа, както те са излезли на първа страница на Гугъл? Какво взима предвид Гугъл, за да оцени кой да е първия, втория, третия и т. н. според новите неща?
Дидо Григоров: Ами по последните тестове, които са правени и показвани изцяло он лайн, Гугъл използва тотално machine learning. Т. е. базирано на самообучение класиране. Това е нормално, защото фразите вече са не милиарди, а трилиони, те са ужасно много и няма някой да следи двадесет и четири часа дали, защо и как нещо е класирано така или не, макар че се продължава и аз съм абсолютно сигурен (в интернет се говори, че се продължава), дори и в не големи мащаби…
Алгоритмите, които Гугъл използва са като всяка друга търсеща машина като Bing или като Yahoo и пр., с тази разлика, че както кастъмизираме всеки софтуер, Гугъл също има кастъмизирани модели. Има си основни, базови модели, които са познати още преди много години назад, много от тези модели въобще не са нови, те са на 10, 12, на 30, някои са даже на 40 години като съществуване. Това, което се случва е, че се следят тъй наречените фючъри, самите характеристики на уеб сайта първо като съдържание. Техническото SEO е важно особено при процеса на кроулинг и на индексинг, също рендерирането, защото от там тръгва всичко за да може нататък да бъде разбрано съдържанието. Но след това като е преминато това като стъпка, Гугъл веднага се прехвърля към така наречените характеристики на които се обръща внимание за релевантност, за потребителско поведение, но не в тази форма, в която повечето хора го мислят. И точно тук идва богатството на machin elearning! Той сам си определя в реално време кои да бъдат тези ранкинг фактори. Впрочем аз не обичам думите ранкинг фактори, защото реално такива няма… Много хора живеят и битуват в този мит, но е голяма грешка да го мислиш така…
Борислав Арапчев: … особено в Индия… 🙂
Дидо Григоров: …ами особено в Индия, да……мислейки си, че има генерални фактори и ако не ги спазим, няма да се класираме… Пълна глупост!!! Това не е вярно изобщо! Просто много е важно да следим във всяка една ниша кои точно са сигналите, какво Гугъл определя като важни характеристики…
Вчера имаше едно изказване, (май беше в блога на Гугъл) че следят дори устройствата, които използваме за търсачката, разстоянията – ако се търси нещо локално, обръща се внимание на историята на търсенето, на предишните кликани документи и т. н… . И това е напълно нормално, т. е. точно тук идва тази кастъмизация, която я има в моделите на класиране. Затова някакъв еднозначен отговор за някакви модели не би бил полезен за аудиторията… По-скоро полезно е да се прави разглеждане на уебсайтовете на конкуренцията в дълбочина, да се следи кое е отличителното там и оглеждането с малко по-друг поглед, (не чисто – те имат това, а ние нямаме това…) ами да получиш отговор, задавайки си въпроса ЗАЩО търсачката е класирала това нещо, КОИ могат да бъдат евентуалните ПРИЧИНИ за това класиране… Но ако хората се опитват да разгадаят самите ранкинг алгоритми, няма как да стане, защото са много. В нашия Център на знанието има статия, писана за това нещо. Алгоритмите в действителност са наистина много – те са, може би, около сто и ако трябва да ги класифицираме за да кажем, че Гугъл използва това или това и това, то е ясно, че никой не може да каже кои ще се използват или се използват в даден момент…
Тук пък е другото богатство на machine learning. Той може да си избере точно кои модели да използва за да се получат максимално релевантни резултати. Никой няма как да знае дали отзад нямаме 50-60 модела, които да работят и на база на фраза, на база на документите, които сме писали, machine learning-а да си каже: а!…, и точно този тест, да речем примерно, пет пъти по десет модела, той подава към потребителя… Когато потребителят почне да кликва и има някаква неконсистентност в данните или някакви данни се припокриват, вече започва да се взима някакво решение за това как да бъде направено класирането… Това е най-общо казано с думи, но нямаме време да влизаме в детайли…
Борислав Арапчев: …да, наистина, а имаме и въпроси да ти задам… Борислав Петров ни пита може ли да дадеш някакви препоръки за контент на онлайн магазин с голям брой продукти, които имат базово описание, но заради големият брой не може да се напише голямо описание на всеки продукт – освен, може би в блог?
Дидо Григоров: Така! Джон Мюлер много пъти е казвал, че при поставянето на съдържание особено НА и КЪМ уеб сайтовете е нещо напълно нормално, т. е. Гугъл са наясно с това нещо и никога не биха го направили на проблем…
Аз обичам да давам тук примера с маратонките на Nike – ако те са някакъв нов модел, но се различават от другите само по цвят, то напълно нормално е да нямаме особена разлика в описанието… Добре е, обаче, бизнесът да провери (и това е много важно!!!) кой е основния, базовия модел, който се продава в дадена серия, дали за тези маратонки белия цвят е основен там или синия, за да може да се напише най-доброто съдържание. Защото в следващите модели, съответно, промените ще бъдат много малки…. Така или иначе характеристиките на маратонките са еднакви – това е напълно нормално… Но защо е важен основния, базовия модел? Защото той ще носи следващите, той просто ще бъде свързан със следващите и ако там нещата са ОК!, той, съответно, е първата индексирана страница, която търсачката разглежда и класира… Оттам той ще носи трафик и към останалите страници с продукти. Затова категоризиране и класифициране ВИНАГИ ИМА… Няма как да не съществува това нещо… просто трябва да се потърси по какъв критерий се прави това…
Борислав Арапчев: Задавам ти друг въпрос – Златан Иванов пита – в случай ако топ 10 документа на определена фраза за статии имат 0 referring domains, струва ли си да градим беклинкове от директории? Дават ли преднина? Това е малко по-друг въпрос, но все пак какво е твоето мнение?
Дидо Григоров: И да, и не… Гугъл наскоро обявиха, че използват един много интересен алгоритъм – TI франкинг, който е всъщност събирателя на всички тези алгоритми и алгоритмични модели, които ги споменахме по-рано, но там има една малка подробност – метриките се сменят постоянно… Ако някой при тези конкуренти реши при равни условия да направи нещо ново, – в случая – да създаде 100 referring домейна, и този някой се намира на 9 позиция, това, тъй като имаме разлика и ако франкинг моделът (със своите подмодели) отчетат, че има разлика от конкурентите, от 9 позиция този някой може да се качи на по-предните и даже на първа позиция може… Това ще принуди всички останали да промотират съдържанието. Но има и случаи, в които дори и без линкове да имаме някакво класиране. Това е абсолютно вярно, Gary Illyes на няколко пъти го е споменавал, така че и без линкове може да имаме някакво класиране.
Така или иначе това класиране с линковете може да се промени във времето, защото това може да се случи по много естествен път – хората може да линкват към дадено съдържание по естествен начин като им стане нещо интересно, да започнат да пишат от блог постовете си и да изпращат линкове към продуктови и блогови страници и т. н. Това е променлива във времето. Гугъл са създали своя основен модел ти а франкинг така, че да ни държат на нокти… за да имаме постоянно работа……
Нищо не е сигурно и постоянно… Ако сега за 3, 4, 5 или 6 месеца си на първа позиция, то на следващия месец може да отидеш и на девета. Значи там има някаква разлика, която ти трябва да откриеш, провериш и анализираш като видиш каква допълнителна стойност може да предложиш…
Борислав Арапчев: Добре… ето и два бързи въпроса, защото времето ни изтича… Борислав Петров те пита в допълнение към въпроса за началната страница – брандовият текст на началната страница, трябва ли да се развие повече към нишата в която е бранда или е по-добре да се придържа към самата фирма – история, развитие и т.н за самият бранд?
Дидо Григоров: Не, не, не, не… По-общо трябва да бъде, по-скоро като визитка, но по-разширена, обаче… като обща презентация за бизнеса…
Например: услугите, с кратка информация за бизнеса с препратки към страницата „За нас“, услугите, с препратки, тестимониъли, т. е. отзиви с някакви препратки и пр. И дори няколко блог поста чисто като информация, за да се провери, че бизнесът има експертиза, сертификати, награди (защото това е най-важното нещо) или участия в събития – но да е нещо по-генерално…
Борислав Арапчев: Иван Ранчев пита: смятате ли, че ранкинг сигналите са различни на база всяко конкретно запитване (query), а не на базата на цялата вертикала?
Дидо Григоров: Зависи от много неща… виждали сме и трите варианта при нас в Serpact.
Имало е и на ниво ниша, били са еднакви за цялата ниша, без значение фразите, имало е и на ниво фрази, имало е и на ниво клъстери от фрази, т.е. категоризация на фрази и ядро от фрази, при което при дадената фраза с някакъв основен phrase pattern, т. е. някакви думички, които се повтарят, всички останали phrase match в даденото ядро имат почти еднакви или много близки сигнали като цяло. Точно ерата на machine learning промени всичко това.
Борислав Арапчев: Пристъпваме към нашия забавен въпрос към сегашната ни аудитория… Но докато хората пишат своите отговори, последен въпрос към теб: какви са твоите съвети за стратегията на всеки бизнес за да се подготви той за бъдещето, за идващите промени в дигиталната сфера? Какво би посъветвал да се планира?
Дидо Григоров: Започвам оттам, че Гугъл върви изцяло към machine learning и към search… Т. е., бъдете на вълната на conversational search… Колкото и базови да ви се струват дадени въпроси, отговорете на тях по най-добрия начин, дори ако се налага да се създаде цяла една тема стратегиране, категоризирайте и бъдете индивидуалисти, защото във всеки един случай ако правите същото, което правят конкурентите ви, си задайте въпроса – има ли смисъл Гугъл да ме класира над някой от тях, тъй като аз съм същия?
Борислав Арапчев: … т. е. аз копирам всичко и няма никаква стойност и полза от мен…
Дидо Григоров: Да… Хубаво е, че днес имаме фокусирана аудитория, за което аз съм много щастлив. Тук е момента да го кажа: ВНИМАВАЙТЕ КАКВО ПИШЕТЕ – ГУГЪЛ ВЕЧЕ РАЗБИРА ВСИЧКО.
След въвеждането на BERT вече се говори и почти е установено, че търсачката разбира съдържанието почти като човешки мозък.
Борислав Арапчев: Значи предстоят много изненади и много интересни неща в нашата сфера.
Дидо Григоров: Много, много, много скоро стратегиите за съдържание ще бъдат задължителни. Не препоръчителни – ЗАДЪЛЖИТЕЛНИ!
Борислав Арапчев: Предлагам последен въпрос, тъй като времето ни свърши… Борислав Кирилов ни пита: Очаква ли се междуезиково конкуриране в локални пазари – например Гърция, България и Румъния ще се конкурират ли независимо от различните езици на сайтовете?
Дидо Григоров: Не! Гугъл продължават да налагат своите най-добри практики за интернационализация. Те по-скоро, може би ще искат да диференцират и така с диференциацията language моделите ще се оформят още по-добре. Иначе при една голяма смеска между много езици, ще се получи една.
Борислав Арапчев: … каша!
Дидо, благодаря ти за много полезната и интересна информация, която поднесе. Надявам се да е било интересно и полезно и за аудиторията…
Благодаря ти, Дидо, че прие нашата покана да участваш в разговора днес по тези изключително актуални и полезни неща…
Дидо Григоров: И аз благодаря… всичко добро… …:)
Борислав Арапчев: Всичко добро. До нови срещи… …:)