don_katalan (
don_katalan) wrote2024-09-28 01:26 pm
![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вячеслав Ільченко · На прохання друзів: як працюють фейсбучні алгоритми.
Перш за все: як я уже одного разу зауважував, Фейсбук соцмережею став випадково, і ніхто толком не розуміє, яка саме комбінація факторів стала ключовою - інакше б на ринку з'явилось повно конкурентів. Бажаючим я кину свою статтю на цю тему в перший комент.
По-друге, Фейсбук перетворюється не на ЗМІ, а на супермаркет. Як, власне, і взагалі весь Інтернет - це тренд останнього десятиліття. Напевне, треба буде якось розібрати причини зсува від геоінформаційної системи до геоторгівельної системи, який відбувся так різко, що багато хто дивиться на всі боки і не розуміє "where world wide web went wrong" (пробачте, дуже вже красиво цей каламбур звучить англійською - він літературно перекладається як "де всесвітньо протягнуте павутиння зійшло на пси"). Однак це те, що ми маємо у якості об'єктивної реальності - Інтернет із геоінформаційної системи перетворився на геоторгівельний супермаркет. Фейсбук - просто частина цього тренду, який є найближчим до нас.
По-третє, як і в будь-якій програмній системі, деякі алгоритми Фейсбука можна обійти, а інші поламати - як учив Морфеус. Старий Морфеус.
Ні, я не "раджу всім оновлювати систему і тримати палець", я уже десь розбирав цей стандартний розгін, який використовується для зондування глибини поширення текстів.
Просто я знайшов кілька дірок в фейсбучному алгоритмі, якими б хотів із вами поділитися.
ПОПЕРЕДЖЕННЯ: Все нижченаведене я розповідаю по десктопній (браузерній) версії - бо телефонною користуюсь лише в режимі месенджера. В телефонній прикладці все може відрізнятись, але принципово - підхід той же.
Отже, загальна стрічка Фейсбука працює "від взаємодії". Тобто, чим частіше ви коментуєте на якійсь сторінці, не просто ставите там лайки, сердечки чи щось іще - а саме залишаєте достатньо довгі (за моїм досвідом - порядка трьох-чотирьох речень), або часті коменти, тим частіше вам будуть видаватись пости з цієї сторінки в загальній стрічці. Наприклад, якщо хочете бачити більше моїх постів - коментуйте у мене. Так само як я іноді все-таки ходжу коментувати на сторінки людей, чиї обнови я хочу бачити.
Також у Фейсбука є доповняльна стрічка, про яку не всі знають. Подивіться на ліву частину сторінки. Там є такий пунктик, "Стрічки" - там ще іконка з маленьким годинничком внизу. Натисніть на нього, і ви перейдете в доповняльну сторінку, в яку гамузом скидаються всі оновлення у ваших френдів. Загалом ця стрічка представляє собою свого рода невпорядкований масив, але і його можна впорядкувати. Для цього вам необхідно зайти на сторінку френда, чиї нові пости вам хочеться бачити "в реальному часі", і натискаєте на кнопку "Друзі" - вам видасться невеличка підменю, в якому ви побачите контурну зірочку і напис "Вибране". Натисніть на цю зірочку - іконка зміниться на заштриховану зірочку. Тепер алгоритм Фейсбука буде ставити пости від цього френда нагору доповняльної стрічки. Зловживати цим не варто - за моїм досвідом Фейсбук розпізнає лише перші 10, максимум 20 "вибраних", після чого перестає на цей параметр реагувати.
Тепер поговоримо про те, як впорядкувати нав'язливу рекламу і підсовування різних сторінок.
Найпростіше - "закликувати їх". В правому верхньому кутку "рекомендованого для вас" повідомлення є величезний хрестик. По ньому таки можна клікнути, і цього в принципі достатньо. Якщо ви протягом 30 днів (період оновлення статистики) будете системно "заклікувати" ті повідомлення, які вам не подобаються, рекомендованих сторінок менше не стане, зате серед них стане значно менше тих, які викликають у вас роздратування. Наприклад, я системно "заклікував" всі сторінки, на яких немає публікацій з історії, технології - чи хоча б не було цікавих картинок (гусари, мовчати! - кому сильно цікаво, можливо, покажу, які картинки я залишив у себе в стрічці). І о диво - за місяць у мене пропала більшість клікбейтних історій про "ніщасливу любофф в стилі соцреалізма" - ви ж, либонь такі самі бачили. Зате тепер Фейсбук окрім певного відсотка мотлоху підсовує мені багато дійсно корисних публікацій про історію, пам'ятки архітектури, кінофільми, класичну фантастику і все таки - правда, в більшості англомовне. Для мене тут особливої біди нема - я вільно читаю англійською. Але це значить, що українська інфосфера в цьому плані, очевидно, досі вкрай бідна (це спостереження має мотивувати створювати контент)...
Але більш практичним способом є маніпулювання (ага!) штучним інтелектом, який займається профілюванням користувачів Фейсбука. Ще задовго до війни Forbes видав дуже цікаву статтю, в якій описував, як використовується штучний інтелект в Фейсбуці (поставлю в коменти, але вона англомовна). Серед всього іншого там описувався нейромережевий інструмент, який зветься DeepText. Його задача - аналізувати тексти постів і ділити його на ключові слова та вирази. Вони потім використовуються для аналізу на "порушення правил спільноти" та - увага - "спрямування людей до речей і товарів, які могли б їх зацікавити".
Саме тому я, окрім серйозних статей та аналізів, ставлю абсолютно несерйозні пости про книги, фільми, ігри, мангу та інші речі, які мені подобаються. Deep Text аналізує все це і робить саме те, що мені треба - ранжує список рекомендованих і рекламних сторінок відповідно ключовим словам, які "напрофілював" з моїх постів. А мені, хе-хе, якраз того і треба. Наприклад, написав я вчора про "Зоряні Війни: Лицарі Старої Республіки" - сьогодні Deep Text уже мене "запрофілював" і в стрічку мені додали картинок і роликів про KotOR.
Також, будьте обережні - Deep Text за десять років на місці не стояв, і розпізнає стандартну стратегію маркетологів, коли в "продаючий текст" запихують якомога більше ключових слів. Найкраще він реагує на "особисті" пости із враженнями (так, Deep Text уміє відрізняти product placement від вражень - це нескладна задачка по аналізу висловлювань).
Само собою, всім вищепереліченим необхідно займатись постійно. Це має стати частиною щоденної інформаційної гігієни. Як і в житті - ви ж кидаєте трубку, коли вам дзвонить черговий ушлий продаван, у якого "необмежена кількість фріспінів, без реєстрації та смс"? Ви ж підбираєте собі читання і кінопрограму за смаками? Так і тут.
І будь-ласка, не зловживайте поширенням постів. А то у Фейсбука є й інший нейромережевий інструмент, який відстежує спам і "накручування лайків" за допомогою суггестивних прийомів (це один із нечесних маркетологічних методів, коли вас змушують придбати товар чи поширити повідомлення, використовуючи спеціальні "ударні" слова чи картинки). І його функціонування... скажімо так, залишає бажати кращого.
Про всяк випадок я офіційно попереджаю: цим постом я не намагався отримати лайки чи визнання. Мною рухало тільки і виключно бажання допомогти друзям розгрести мотлох в їх стрічках, на що вони скаржаться і відкрито.
І дуже сподіваюсь, що вам всім мої скромні поради допоможуть.
-----
Вячеслав Ільченко
28 липня 2023 р. ·
В світлі перейменування Твіттора на Х[рюшу], яким Ілон Маск поставив на вуха не лише всіх користувачів цієї соцмережі, а й багатьох, хто лише вряди-годи про неї чув - я все-таки вирішив спробувати дати хоча б приблизну відповідь на головне питання, яке зараз хвилює всіх без виключення користувачів Інтернету:
- а чому, власне, ми мусимо терпіти модераторську сваволю (якщо не сказати гіршого слова) Цукерберга та Маска? Чому ніхто не створить кращу соцмережу, в якій не буде ані тіньових банів, ані понижень актуальності, ані нав'язливого контроля контента?
Коротка відповідь: бо Facebook та Twitter є унікальними продуктами глобального рівня, до функціоналу і швидкодії яких іншим соцмережам дуже і дуже далеко.
При тому, що спроби створити їм конкуренцію не вщухають ані на секунду - взяти хоча б проект Mozilla.social, або Blue Sky (створену колишнім співвласником Твіттора Джеком Дорсі), або Discord (який, до речі, став справжнім хабом для різноманітних систем штучного інтелекта), або WikiTribune Social (створену Джиммі Вейлзом, со-творцем Вікіпедії, у якості "нетоксичного" аналога Фейсбука та Твіттора), або навіть, прости Господи, Truth Social (спеціалізована соцмережа, створена під виборців Трампа, яка так і не "злетіла", через що Маску і довелось купувати Твіттор). Не слід також забувати Телеграм, який став поступово набувати рис соцмережі (там з'явились навіть сторізи, які є мейнстримною ознакою "соцмережевого стандарта"), Тік-Ток та всякі Тіндери. Як бачите, конкуренція надзвичайно жорстка - і якщо за таких умов Facebook та Twitter зберігають позиції та величезну користувацьку базу, на сьогодні цим двом супер-соцмережам аналогів та альтернатив на жаль, немає. Само собою, подібна безальтернативність і призводить до суто споживацького ставлення до юзерів: а куди вони всі подінуться, повоняють і перестануть, як казав один із персонажів українського політикума.
До речі, а ви пам'ятаєте, як майже десять років тому була розгорнута ціла кампанія про створення "соцмережі для українців"? Вона називалась We.UA. Після оголошення бета-тесту в квітні 2014 р. там сходу зареєструвалось майже 235 тис. користувачів. Там навіть хостилось кілька цікавих волонтерських проектів - зокрема, благодійний аукціон для потреб родин загиблих на Майдані та Східному фронті. До розкрутки мережі долучились Віталій Портніков, Володимир Парасюк та Анастасія Дмитрук (це та поетеса, яка написала вірш "Никогда мы не будем братьями", що став трендом в 2014 р.). Однак в 2015 році мережа уже практично не функціонувала - а на додачу її розробників ще й звинуватили в розкраданні волонтерських коштів, так що її зрештою довелось взагалі закрити. Розробники спробували ще раз створити соцмережу - InRepublic - але і цей проект "не злетів".
Це була далеко не перша і не остання спроба створити хоча б локальну українську соцмережу. Насправді таких спроб було дуже багато - першою вважається "патріотична соцмережа" під назвою "Українці", створена в 2009 році. Але я все-таки веду відлік від проекту "Ідеальна Країна", створеного в 2007 р. командою партії "Батьківщина" як проблемно-орієнтований портал, який неочікувано навіть для самих розробників став перетворюватись на соцмережу (якось я окремо спробую пояснити, чому так сталось - і чому саме цей приклад важливо розібрати). Останні спроби - соцмережі "Тенета" (2022), та FaceUkr (2020) - обидві, що цікаво, позиціонувались як альтернатива Фейсбуку. Найбільшої аудиторії вдалось добитись соцмережі "Ukrainians.co", створеній в 2017 р. вітчизняною програмісткою та бізнесменкою Олександрою Струмчинською - вона зібрала цілих 400 тис. користувачів, але все одно закрилась.
Для порівняння: за підрахунками статистичної компанії WiseVoter, станом на 2023 р. в Україні налічувалось 24 млн. активних користувачів Фейсбука. Це 75,04% всіх інтернет-користувачів, локалізованих в Україні. В Твітторі же, за підрахунками World Population Review, "сидить" всього 595 тис. чол. В обох випадках враховувались лише ті користувачі, які не лише "почитати" заходять, а й щось пишуть. В Телеграмі сидить 10,76 млн. чол. (підрахунок здійснений World Population Review на базі унікальних телефонних номерів, куди була скачана прикладка). Крім того, люди також продовжують зависати "Вконтакті" (якщо вірити офіційній статистиці, 2,88% користувачів ВК - локалізовані в Україні, а це приблизно 1,85 млн. чол.).
Тобто, для того, щоб українська мережа "злетіла" і склала значущу конкуренцію існуючим соцмережам - їй необхідно досягти хоча б рівня Твіттора, тобто, порядка 600 тис. активних користувачів. Але якби все було так просто...
Якщо проаналізувати всі спроби створити соціальну мережу - неважко побачити, що практично всі вони є спробами "повторити успіх". Іноді це вдається. Наприклад, мало кому відомо, що "Однокласники" представляють собою клон американського проекта Classmates страшно сказати, ще 1995 р. (ага, вони просто тупо переклали назву і сперли функціонал). А "Вконтактик" - клон раннього концепта Facebook (він навіть початково носив назву Studlist, копіюючи етимологію оригіналу, бо facebook - це, вибачте, випускні шкільні та студентські альбоми), який засновувався не на обміні враженнями і думками, а на обміні файлами. Якщо комусь цікаво, потім подивитесь, що таке "проект Wirehog" - якщо в двох словах, Марк Цукерберг початково планував перетворити свою соцмережу на просунуту файлшарингову мережу, але відмовився від цієї ідеї через жорсткі закони США по копірайту і прецедент справи проти Napster в 2000-2001 рр. А Павло Дуров навпаки, ухопився за цю ідею, і саме за її рахунок - як файлшарингова соціальна мережа - "Вконтакті" став таким мегапопулярним. Згадайте, коли заборонили "Вконтактик", люди більше за все бідкались, що втратили доступ до музики та фільмів. Аз грішний, хоч і аккаунта там не мав, але деякі рідкісні анімешки та моди для ігор в ті часи також таскав саме з ВК (зараз моїм основним джерелом стали Discord, NexusMods та ModDB).
Але намагаючись "створити аналог" чи "повторити успіх", розробники одночасно потрапляють в кілька пасток, які навіть в найкращій своїй комбінації означатимуть "розробницьке пекло" (development hell - це такий термін для хаоса в процесі розробки, де аврал йде за авралом, система обростає кошмарною кількістю костилів та заплат і зрештою вимагає неймовірних зусиль на просте підтримання функціоналу) - по класифікації Едварда Йордона, безнадійний проект класу "камікадзе" із дуже низькими шансами реалізації (кому цікаво, звідки я цю класифікацію взяв, прочитайте книжку Едварда Йордона "Шлях камікадзе").
Власне, це і є базове пояснення: чому так і не вдалось створити дієву конкуренцію Facebook та Twitter - а тому, що нікому не вдавалось вибратись із численних пасток спроби повторення успіху. Причому кожна із тих пасток - окрема велика тема, так що я дам лише дуже побіжний начерк найбільших.
Перша пастка - пастка цілепокладання. Соцмережа повинна мати власну мету, а "створення аналога Y чи X" (sic!) - не мета. Це гонка Ахіллеса і черепахи, яку можна виграти тільки інтегральним підходом - тобто, одразу реалізувавши повноцінний клон хоча б з точки зору функціоналу, щоб при переході користувач відчув мінімальний дискомфорт (а для цього необхідна надпотужна команда розробників, та значні капіталовкладення прямо зі старту - а на це здатна хіба що така ж за розміром корпорація). У всіх інших випадках Ахіллес ніколи не дожене черепаху, sad but true.
Хоча теоретично Ахіллес все-таки може догнати черепаху - але це вимагатиме дуже тривалого часу і залучення надзвичайно широкої масової співпраці. На сьогодні ми знаємо лише один приклад, коли подібній команді розробників не лише удався "проект-камікадзе", а й вдалось створити свою власну ринкову та технокультурну нішу. Я говорю про Linux, а точніше, віконні менеджери KDE та GNOME, які й дозволили "потіснити" на ринку Windows (особливо собі відмітьте - обидва ці проекти знайшли свою власну мету і модель розвитку, а не намагались склонувати Windows "один-в-один"). Від подібного майже унікального випадку, коли люди буквально закусюють удила і гнуть своє протягом навіть не років, а десятиріч - та ж сама Meta активно страхується за допомогою патентного права, щоб можна було закошмарювати розробників вимогами дотримання патентної оригінальності.
Під час написання даної статті я спеціально зайшов на сайт USPTO - Патентного Бюро США - щоб підкріпити свою тезу. Там я забив в поле пошуку власника патента ключове слово Facebook... і просто остовпів. От як ви думаєте, скільки патентів зареєстровано на корпорацію Meta (також відому як Facebook, Inc.) і стосуються соцмереж? Тисяча? Дві тисячі? Більше ДЕСЯТИ ТИСЯЧ. Патентуються навіть найдрібніші деталі - це, власне, одразу і відповідь очевидному аргументу "та що там дрібушити, беремо фрішний движок і тупо клонуємо інтерфейс" (повірте, я сам пробував такий підхід і це був один із найбільш болючих моїх провалів, історію якого можливо, я наберусь сміливості розповісти).
Наприклад, вам подобаються красиві аватарки із тривимірним ефектом, які генеруються на основі вашої лицьової фотографії? Патент № US-11423616-B1.
Поділ повідомлень в месенджері на "ланцюжки", згруповані по імені френда? Патент № US-11316813-B1.
А оці маленькі ролики, які називаються Reels і явно складають конкуренцію Тік-Току? Патенти № US-D944848-S, US-D944827-S, US-D944281-S та US-D944280-S (і це ще не все, а тільки базовий інтерфейс "карусельки з роликами").
А обмеження на мене накладали на основі алгоритмів автоматизованої класифікації медіа-контенту, запатентованих під номерами US-11282509-B1, US-11250030-B2 та US-11354380-B1.
Коли будете забивати номери в пошуковку USPTO, не забудьте - я називаю міжнародний номер патента, а в пошуку треба вказувати тільки власне номер, який зазначено між знаками "тире".
По патентам навіть можна визначити, в який бік збирається розвиватись Facebook. Судячи з величезної кількості патентів, які стосуються променево-голографічних проекторів, носимих пристроїв доповненої та віртуальної реальності та численних алгоритмів відображення віртуальних об'єктів в реальності та навпаки, реальних - у віртуальності - Meta серйозно націлилась на створення соцмережі на основі віртуальних проекцій. Поняття не маю, як це буде виглядати, але швидше за все, щось схоже на комбінацію Second Life (це така віртуальна освітня та соціальна площадка, приблизно 1 млн. користувачів) та MMORPG, тобто, масової багатокористувацької рольової гри - у якості прикладу можна назвати Star Wars: The Old Republic (12,1 млн. користувачів) та The Elder Scrolls Online (4,9 млн. користувачів).
І це - уявіть собі, ми лише першу велику пастку розібрали. Є іще дві, співставні за розміром. Точніше одна, просто в ній "два відділення", а всередині ще і ще.
Будь-яка соціальна мережа перш за все є способом збереження життєпису. Пам'ятаєте, якось гуляв по стрічці текст про те, що "Facebook примудрився стерти наше життя" - бо якщо десь відбудеться масштабний збій, люди втратять не просто дані, а свідчення і спогади про шматок власного життя. Це ставить дві проблеми - технологічну та юридичну. Юридична стосується права власності на персональні дані - я її навіть побіжно розбирати не буду, бо там воз і маленький возик питань, над якими сушать голову юристи всіх країн світу, куди розумніші за мене (там і кейс Cambridge Analytica, нав'язлива реклама, кібербуллінг, численні кейси винесення державних реєстрів на аутсорс в приватні сховища - наш уряд теж "об цю дошку пошани відмітився", достатньо глянути Постанову №263 від 12 березня 2022 р.). Сам Цукерберг неодноразово попадав під довжелезні судові процеси, і вони далеко не закінчені.
А технологічна полягає в самій збережності даних. Ну добре, я роблю періодичні бекапи - бо постійно ходжу на межі бана - а мільйони і мільярди інших користувачів (в FB 2,2 млрд. активних користувачів, єслічо)? Ось вам статистика. Щодня Facebook мусить зберегти додатково біля 4 петабайтів інформації (1 петабайт - мільйон гігабайт, приблизно як 600 млн. книжок середньої товщини), більше обробляє хіба що комплекс Великого Адронного Коллайдера (15 петабайт на експеримент). Як така кошмарна цифра утворюється? За підрахунками аналітичної компанії Bernard Marr & Co щодня в Фейсбуці реєструється 400 нових аккаунтів. Щодня завантажується 300 млн. фотографій (загалом кожен юзер постить по 10 картинок на день, включно із мемасиками в коментах - так що реально ця цифра куди більша). Щохвилини викладається 510 тис. коментів і 293 тис. постів. До цього слід додати ще порядка 16 млн. текстових повідомлень через месенджери на день. Навіть якщо врахувати, що Facebook щоквартально видаляє порядка півмільйона аккаунтів по класифікатору (ботоферми, порушення Правил Спільноти і просто "за компанію", випадки ми всі знаємо) - все одно кількість даних, які викладають користувачі щодня, астрономічна. Її треба десь зберігати.
Вище я назвав межу аудиторії, яка потрібна для того, щоб українська соціальна мережа змогла реально конкурувати із існуючими. Я нагадаю її - 600 тис. активних юзерів. Давайте прикинемо, який для цього необхідний обсяг сховища. 10 картинок на день дає в середньому 15 Мб (1,5 Мб - середній розмір картинки в форматі PNG 1024 x 1024). Кількість коментів, які в день робить 1 юзер - порядка 300-330, отже, йдеться про 5 Мб на день (макс. розмір комента 8 тис. знаків, а 1 знак - 2 байти). Великі пости люди пишуть в середньому раз на 4 дні, і від 2 до 4 малих статусів на день, що дає нам додатково максимум 1 Мб (макс. розмір поста 63 тис. знаки, середній розмір малого статуса - 2 тис. знаків). Довжина ціє статті, якщо вам цікаво - 29,4 тис. знаків.
Отже, в день 1 користувач генеруватиме 21 Мб даних в цілому. Мало. Але за рік ця цифра становитиме - 365 x 21 = 7665 Мб, тобто, 7,4 гігабайти даних. Тобто, на одну людину хостинг соцмережі має передбачити 7,6 Гб даних на рік (плюс 0,2 гіга на піковий випадок). А максимальний обсяг бізнес-хостинга в Україні (для фізособи) становить всього 144 Гб. Це ставить хрест на будь-яких незалежних розробках соцмережі "своїми силами", бо максимальна кількість юзерів буде обмежена 10-20 особами. Для тестування движка нормально, а ось для запуска соцмережі цього не те що недостатньо, а це все одно що на Місяць летіти, махаючи руками. Колись приблизно на такі ж цифри та висновки я вийшов чисто практично, коли адміністрував невеличкий "клубний" сайт.
Для "пробиття скляної стелі аудиторії соцмережі" буде необхідний датацентр із щорічним ростом хостингу на 4,5 петабайти (не забудемо, у ФБ такий ріст ЩОДНЯ) - із урахунком можливого пікового навантаження, бо всі ми пам'ятаємо, що відбувається у випадку значущих подій - всі різко починають постити, реагувати, і звичайно, сваритись і сратися. Саме тому, до речі - це "секрет Полішинеля" - на початкових етапах запуску Facebook Марк Цукерберг всіляко тормозив ріст кількості користувачів, навіть ризикуючи втратою довіри інвесторів, аж поки не добився випереджуючого роста обсягів хостинга - саме тоді і відбувся глобальний, вибухоподібний бум на Facebook.
Переводячи в матеріальну площину, йдеться про тисячу звичайних "винтів", які треба просто щороку ставити в стойку. Один такий жорсткий диск в найдешевшій категорії коштує 4,5 тис. грн. (а краще все-таки брати щось понадійніше).
Отже, "мінімальна ціна входу" хоча б на український ринок соцмереж, із орендованим приміщенням під датацентр, уже готовим движком і командою модераторів - 4,5 млн. грн., або 119 тис. дол. Якщо рік-два протримались, тоді можна уже сподіватись на якісь інвестиції.
... невже все так погано, і надії нема? Ні, надія завжди є.
Facebook, давайте будемо говорити чесно, надзвичайно далекий від досконалості. На сьогодні він експлуатує все ті ж самі ідеї та підходи, які в нього закладались двадцять років тому. Він навіть технологічно в ряді аспектів так і залишився в часах Internet 1.0. Спробуйте, наприклад, оформити свій пост різними шрифтами, чи вставити картинки не після тексту, а безпосередньо в ньому. А ці можливості закладено в стандарти HTML ще 20 років тому, з тих часів уже два рази стандарт оновлювався в бік ще більшої комплексності контента. Той, хто дасть користувачу можливість піти від "лінійного текста" і хоча б забезпечить елементарну гіпертекстуальність (від терміна "гіпертекст") життєписа - уже отримає ключову перевагу над Facebook.
Однак це не головне. Необхідно придумати ключову ідею, навколо якої буде збудована соцмережа. Знаєте, яка була ключова ідея Facebook? Я про це уже натякав. Готові? ІНТЕРАКТИВНИЙ ФОТОАЛЬБОМ. Ага, зараз це смішно читається, а однокашники Цукерберга пригадують, що на початку він від свого дітища вимагав лише двох речей - "більше фоток і швидкодії".
Але про ідеї, цілі та архітектуру соцмереж в цю статтю уже не влізе - про це ми поговоримо наступного разу.
По-друге, Фейсбук перетворюється не на ЗМІ, а на супермаркет. Як, власне, і взагалі весь Інтернет - це тренд останнього десятиліття. Напевне, треба буде якось розібрати причини зсува від геоінформаційної системи до геоторгівельної системи, який відбувся так різко, що багато хто дивиться на всі боки і не розуміє "where world wide web went wrong" (пробачте, дуже вже красиво цей каламбур звучить англійською - він літературно перекладається як "де всесвітньо протягнуте павутиння зійшло на пси"). Однак це те, що ми маємо у якості об'єктивної реальності - Інтернет із геоінформаційної системи перетворився на геоторгівельний супермаркет. Фейсбук - просто частина цього тренду, який є найближчим до нас.
По-третє, як і в будь-якій програмній системі, деякі алгоритми Фейсбука можна обійти, а інші поламати - як учив Морфеус. Старий Морфеус.
Ні, я не "раджу всім оновлювати систему і тримати палець", я уже десь розбирав цей стандартний розгін, який використовується для зондування глибини поширення текстів.
Просто я знайшов кілька дірок в фейсбучному алгоритмі, якими б хотів із вами поділитися.
ПОПЕРЕДЖЕННЯ: Все нижченаведене я розповідаю по десктопній (браузерній) версії - бо телефонною користуюсь лише в режимі месенджера. В телефонній прикладці все може відрізнятись, але принципово - підхід той же.
Отже, загальна стрічка Фейсбука працює "від взаємодії". Тобто, чим частіше ви коментуєте на якійсь сторінці, не просто ставите там лайки, сердечки чи щось іще - а саме залишаєте достатньо довгі (за моїм досвідом - порядка трьох-чотирьох речень), або часті коменти, тим частіше вам будуть видаватись пости з цієї сторінки в загальній стрічці. Наприклад, якщо хочете бачити більше моїх постів - коментуйте у мене. Так само як я іноді все-таки ходжу коментувати на сторінки людей, чиї обнови я хочу бачити.
Також у Фейсбука є доповняльна стрічка, про яку не всі знають. Подивіться на ліву частину сторінки. Там є такий пунктик, "Стрічки" - там ще іконка з маленьким годинничком внизу. Натисніть на нього, і ви перейдете в доповняльну сторінку, в яку гамузом скидаються всі оновлення у ваших френдів. Загалом ця стрічка представляє собою свого рода невпорядкований масив, але і його можна впорядкувати. Для цього вам необхідно зайти на сторінку френда, чиї нові пости вам хочеться бачити "в реальному часі", і натискаєте на кнопку "Друзі" - вам видасться невеличка підменю, в якому ви побачите контурну зірочку і напис "Вибране". Натисніть на цю зірочку - іконка зміниться на заштриховану зірочку. Тепер алгоритм Фейсбука буде ставити пости від цього френда нагору доповняльної стрічки. Зловживати цим не варто - за моїм досвідом Фейсбук розпізнає лише перші 10, максимум 20 "вибраних", після чого перестає на цей параметр реагувати.
Тепер поговоримо про те, як впорядкувати нав'язливу рекламу і підсовування різних сторінок.
Найпростіше - "закликувати їх". В правому верхньому кутку "рекомендованого для вас" повідомлення є величезний хрестик. По ньому таки можна клікнути, і цього в принципі достатньо. Якщо ви протягом 30 днів (період оновлення статистики) будете системно "заклікувати" ті повідомлення, які вам не подобаються, рекомендованих сторінок менше не стане, зате серед них стане значно менше тих, які викликають у вас роздратування. Наприклад, я системно "заклікував" всі сторінки, на яких немає публікацій з історії, технології - чи хоча б не було цікавих картинок (гусари, мовчати! - кому сильно цікаво, можливо, покажу, які картинки я залишив у себе в стрічці). І о диво - за місяць у мене пропала більшість клікбейтних історій про "ніщасливу любофф в стилі соцреалізма" - ви ж, либонь такі самі бачили. Зате тепер Фейсбук окрім певного відсотка мотлоху підсовує мені багато дійсно корисних публікацій про історію, пам'ятки архітектури, кінофільми, класичну фантастику і все таки - правда, в більшості англомовне. Для мене тут особливої біди нема - я вільно читаю англійською. Але це значить, що українська інфосфера в цьому плані, очевидно, досі вкрай бідна (це спостереження має мотивувати створювати контент)...
Але більш практичним способом є маніпулювання (ага!) штучним інтелектом, який займається профілюванням користувачів Фейсбука. Ще задовго до війни Forbes видав дуже цікаву статтю, в якій описував, як використовується штучний інтелект в Фейсбуці (поставлю в коменти, але вона англомовна). Серед всього іншого там описувався нейромережевий інструмент, який зветься DeepText. Його задача - аналізувати тексти постів і ділити його на ключові слова та вирази. Вони потім використовуються для аналізу на "порушення правил спільноти" та - увага - "спрямування людей до речей і товарів, які могли б їх зацікавити".
Саме тому я, окрім серйозних статей та аналізів, ставлю абсолютно несерйозні пости про книги, фільми, ігри, мангу та інші речі, які мені подобаються. Deep Text аналізує все це і робить саме те, що мені треба - ранжує список рекомендованих і рекламних сторінок відповідно ключовим словам, які "напрофілював" з моїх постів. А мені, хе-хе, якраз того і треба. Наприклад, написав я вчора про "Зоряні Війни: Лицарі Старої Республіки" - сьогодні Deep Text уже мене "запрофілював" і в стрічку мені додали картинок і роликів про KotOR.
Також, будьте обережні - Deep Text за десять років на місці не стояв, і розпізнає стандартну стратегію маркетологів, коли в "продаючий текст" запихують якомога більше ключових слів. Найкраще він реагує на "особисті" пости із враженнями (так, Deep Text уміє відрізняти product placement від вражень - це нескладна задачка по аналізу висловлювань).
Само собою, всім вищепереліченим необхідно займатись постійно. Це має стати частиною щоденної інформаційної гігієни. Як і в житті - ви ж кидаєте трубку, коли вам дзвонить черговий ушлий продаван, у якого "необмежена кількість фріспінів, без реєстрації та смс"? Ви ж підбираєте собі читання і кінопрограму за смаками? Так і тут.
І будь-ласка, не зловживайте поширенням постів. А то у Фейсбука є й інший нейромережевий інструмент, який відстежує спам і "накручування лайків" за допомогою суггестивних прийомів (це один із нечесних маркетологічних методів, коли вас змушують придбати товар чи поширити повідомлення, використовуючи спеціальні "ударні" слова чи картинки). І його функціонування... скажімо так, залишає бажати кращого.
Про всяк випадок я офіційно попереджаю: цим постом я не намагався отримати лайки чи визнання. Мною рухало тільки і виключно бажання допомогти друзям розгрести мотлох в їх стрічках, на що вони скаржаться і відкрито.
І дуже сподіваюсь, що вам всім мої скромні поради допоможуть.
-----
Вячеслав Ільченко
28 липня 2023 р. ·
В світлі перейменування Твіттора на Х[рюшу], яким Ілон Маск поставив на вуха не лише всіх користувачів цієї соцмережі, а й багатьох, хто лише вряди-годи про неї чув - я все-таки вирішив спробувати дати хоча б приблизну відповідь на головне питання, яке зараз хвилює всіх без виключення користувачів Інтернету:
- а чому, власне, ми мусимо терпіти модераторську сваволю (якщо не сказати гіршого слова) Цукерберга та Маска? Чому ніхто не створить кращу соцмережу, в якій не буде ані тіньових банів, ані понижень актуальності, ані нав'язливого контроля контента?
Коротка відповідь: бо Facebook та Twitter є унікальними продуктами глобального рівня, до функціоналу і швидкодії яких іншим соцмережам дуже і дуже далеко.
При тому, що спроби створити їм конкуренцію не вщухають ані на секунду - взяти хоча б проект Mozilla.social, або Blue Sky (створену колишнім співвласником Твіттора Джеком Дорсі), або Discord (який, до речі, став справжнім хабом для різноманітних систем штучного інтелекта), або WikiTribune Social (створену Джиммі Вейлзом, со-творцем Вікіпедії, у якості "нетоксичного" аналога Фейсбука та Твіттора), або навіть, прости Господи, Truth Social (спеціалізована соцмережа, створена під виборців Трампа, яка так і не "злетіла", через що Маску і довелось купувати Твіттор). Не слід також забувати Телеграм, який став поступово набувати рис соцмережі (там з'явились навіть сторізи, які є мейнстримною ознакою "соцмережевого стандарта"), Тік-Ток та всякі Тіндери. Як бачите, конкуренція надзвичайно жорстка - і якщо за таких умов Facebook та Twitter зберігають позиції та величезну користувацьку базу, на сьогодні цим двом супер-соцмережам аналогів та альтернатив на жаль, немає. Само собою, подібна безальтернативність і призводить до суто споживацького ставлення до юзерів: а куди вони всі подінуться, повоняють і перестануть, як казав один із персонажів українського політикума.
До речі, а ви пам'ятаєте, як майже десять років тому була розгорнута ціла кампанія про створення "соцмережі для українців"? Вона називалась We.UA. Після оголошення бета-тесту в квітні 2014 р. там сходу зареєструвалось майже 235 тис. користувачів. Там навіть хостилось кілька цікавих волонтерських проектів - зокрема, благодійний аукціон для потреб родин загиблих на Майдані та Східному фронті. До розкрутки мережі долучились Віталій Портніков, Володимир Парасюк та Анастасія Дмитрук (це та поетеса, яка написала вірш "Никогда мы не будем братьями", що став трендом в 2014 р.). Однак в 2015 році мережа уже практично не функціонувала - а на додачу її розробників ще й звинуватили в розкраданні волонтерських коштів, так що її зрештою довелось взагалі закрити. Розробники спробували ще раз створити соцмережу - InRepublic - але і цей проект "не злетів".
Це була далеко не перша і не остання спроба створити хоча б локальну українську соцмережу. Насправді таких спроб було дуже багато - першою вважається "патріотична соцмережа" під назвою "Українці", створена в 2009 році. Але я все-таки веду відлік від проекту "Ідеальна Країна", створеного в 2007 р. командою партії "Батьківщина" як проблемно-орієнтований портал, який неочікувано навіть для самих розробників став перетворюватись на соцмережу (якось я окремо спробую пояснити, чому так сталось - і чому саме цей приклад важливо розібрати). Останні спроби - соцмережі "Тенета" (2022), та FaceUkr (2020) - обидві, що цікаво, позиціонувались як альтернатива Фейсбуку. Найбільшої аудиторії вдалось добитись соцмережі "Ukrainians.co", створеній в 2017 р. вітчизняною програмісткою та бізнесменкою Олександрою Струмчинською - вона зібрала цілих 400 тис. користувачів, але все одно закрилась.
Для порівняння: за підрахунками статистичної компанії WiseVoter, станом на 2023 р. в Україні налічувалось 24 млн. активних користувачів Фейсбука. Це 75,04% всіх інтернет-користувачів, локалізованих в Україні. В Твітторі же, за підрахунками World Population Review, "сидить" всього 595 тис. чол. В обох випадках враховувались лише ті користувачі, які не лише "почитати" заходять, а й щось пишуть. В Телеграмі сидить 10,76 млн. чол. (підрахунок здійснений World Population Review на базі унікальних телефонних номерів, куди була скачана прикладка). Крім того, люди також продовжують зависати "Вконтакті" (якщо вірити офіційній статистиці, 2,88% користувачів ВК - локалізовані в Україні, а це приблизно 1,85 млн. чол.).
Тобто, для того, щоб українська мережа "злетіла" і склала значущу конкуренцію існуючим соцмережам - їй необхідно досягти хоча б рівня Твіттора, тобто, порядка 600 тис. активних користувачів. Але якби все було так просто...
Якщо проаналізувати всі спроби створити соціальну мережу - неважко побачити, що практично всі вони є спробами "повторити успіх". Іноді це вдається. Наприклад, мало кому відомо, що "Однокласники" представляють собою клон американського проекта Classmates страшно сказати, ще 1995 р. (ага, вони просто тупо переклали назву і сперли функціонал). А "Вконтактик" - клон раннього концепта Facebook (він навіть початково носив назву Studlist, копіюючи етимологію оригіналу, бо facebook - це, вибачте, випускні шкільні та студентські альбоми), який засновувався не на обміні враженнями і думками, а на обміні файлами. Якщо комусь цікаво, потім подивитесь, що таке "проект Wirehog" - якщо в двох словах, Марк Цукерберг початково планував перетворити свою соцмережу на просунуту файлшарингову мережу, але відмовився від цієї ідеї через жорсткі закони США по копірайту і прецедент справи проти Napster в 2000-2001 рр. А Павло Дуров навпаки, ухопився за цю ідею, і саме за її рахунок - як файлшарингова соціальна мережа - "Вконтакті" став таким мегапопулярним. Згадайте, коли заборонили "Вконтактик", люди більше за все бідкались, що втратили доступ до музики та фільмів. Аз грішний, хоч і аккаунта там не мав, але деякі рідкісні анімешки та моди для ігор в ті часи також таскав саме з ВК (зараз моїм основним джерелом стали Discord, NexusMods та ModDB).
Але намагаючись "створити аналог" чи "повторити успіх", розробники одночасно потрапляють в кілька пасток, які навіть в найкращій своїй комбінації означатимуть "розробницьке пекло" (development hell - це такий термін для хаоса в процесі розробки, де аврал йде за авралом, система обростає кошмарною кількістю костилів та заплат і зрештою вимагає неймовірних зусиль на просте підтримання функціоналу) - по класифікації Едварда Йордона, безнадійний проект класу "камікадзе" із дуже низькими шансами реалізації (кому цікаво, звідки я цю класифікацію взяв, прочитайте книжку Едварда Йордона "Шлях камікадзе").
Власне, це і є базове пояснення: чому так і не вдалось створити дієву конкуренцію Facebook та Twitter - а тому, що нікому не вдавалось вибратись із численних пасток спроби повторення успіху. Причому кожна із тих пасток - окрема велика тема, так що я дам лише дуже побіжний начерк найбільших.
Перша пастка - пастка цілепокладання. Соцмережа повинна мати власну мету, а "створення аналога Y чи X" (sic!) - не мета. Це гонка Ахіллеса і черепахи, яку можна виграти тільки інтегральним підходом - тобто, одразу реалізувавши повноцінний клон хоча б з точки зору функціоналу, щоб при переході користувач відчув мінімальний дискомфорт (а для цього необхідна надпотужна команда розробників, та значні капіталовкладення прямо зі старту - а на це здатна хіба що така ж за розміром корпорація). У всіх інших випадках Ахіллес ніколи не дожене черепаху, sad but true.
Хоча теоретично Ахіллес все-таки може догнати черепаху - але це вимагатиме дуже тривалого часу і залучення надзвичайно широкої масової співпраці. На сьогодні ми знаємо лише один приклад, коли подібній команді розробників не лише удався "проект-камікадзе", а й вдалось створити свою власну ринкову та технокультурну нішу. Я говорю про Linux, а точніше, віконні менеджери KDE та GNOME, які й дозволили "потіснити" на ринку Windows (особливо собі відмітьте - обидва ці проекти знайшли свою власну мету і модель розвитку, а не намагались склонувати Windows "один-в-один"). Від подібного майже унікального випадку, коли люди буквально закусюють удила і гнуть своє протягом навіть не років, а десятиріч - та ж сама Meta активно страхується за допомогою патентного права, щоб можна було закошмарювати розробників вимогами дотримання патентної оригінальності.
Під час написання даної статті я спеціально зайшов на сайт USPTO - Патентного Бюро США - щоб підкріпити свою тезу. Там я забив в поле пошуку власника патента ключове слово Facebook... і просто остовпів. От як ви думаєте, скільки патентів зареєстровано на корпорацію Meta (також відому як Facebook, Inc.) і стосуються соцмереж? Тисяча? Дві тисячі? Більше ДЕСЯТИ ТИСЯЧ. Патентуються навіть найдрібніші деталі - це, власне, одразу і відповідь очевидному аргументу "та що там дрібушити, беремо фрішний движок і тупо клонуємо інтерфейс" (повірте, я сам пробував такий підхід і це був один із найбільш болючих моїх провалів, історію якого можливо, я наберусь сміливості розповісти).
Наприклад, вам подобаються красиві аватарки із тривимірним ефектом, які генеруються на основі вашої лицьової фотографії? Патент № US-11423616-B1.
Поділ повідомлень в месенджері на "ланцюжки", згруповані по імені френда? Патент № US-11316813-B1.
А оці маленькі ролики, які називаються Reels і явно складають конкуренцію Тік-Току? Патенти № US-D944848-S, US-D944827-S, US-D944281-S та US-D944280-S (і це ще не все, а тільки базовий інтерфейс "карусельки з роликами").
А обмеження на мене накладали на основі алгоритмів автоматизованої класифікації медіа-контенту, запатентованих під номерами US-11282509-B1, US-11250030-B2 та US-11354380-B1.
Коли будете забивати номери в пошуковку USPTO, не забудьте - я називаю міжнародний номер патента, а в пошуку треба вказувати тільки власне номер, який зазначено між знаками "тире".
По патентам навіть можна визначити, в який бік збирається розвиватись Facebook. Судячи з величезної кількості патентів, які стосуються променево-голографічних проекторів, носимих пристроїв доповненої та віртуальної реальності та численних алгоритмів відображення віртуальних об'єктів в реальності та навпаки, реальних - у віртуальності - Meta серйозно націлилась на створення соцмережі на основі віртуальних проекцій. Поняття не маю, як це буде виглядати, але швидше за все, щось схоже на комбінацію Second Life (це така віртуальна освітня та соціальна площадка, приблизно 1 млн. користувачів) та MMORPG, тобто, масової багатокористувацької рольової гри - у якості прикладу можна назвати Star Wars: The Old Republic (12,1 млн. користувачів) та The Elder Scrolls Online (4,9 млн. користувачів).
І це - уявіть собі, ми лише першу велику пастку розібрали. Є іще дві, співставні за розміром. Точніше одна, просто в ній "два відділення", а всередині ще і ще.
Будь-яка соціальна мережа перш за все є способом збереження життєпису. Пам'ятаєте, якось гуляв по стрічці текст про те, що "Facebook примудрився стерти наше життя" - бо якщо десь відбудеться масштабний збій, люди втратять не просто дані, а свідчення і спогади про шматок власного життя. Це ставить дві проблеми - технологічну та юридичну. Юридична стосується права власності на персональні дані - я її навіть побіжно розбирати не буду, бо там воз і маленький возик питань, над якими сушать голову юристи всіх країн світу, куди розумніші за мене (там і кейс Cambridge Analytica, нав'язлива реклама, кібербуллінг, численні кейси винесення державних реєстрів на аутсорс в приватні сховища - наш уряд теж "об цю дошку пошани відмітився", достатньо глянути Постанову №263 від 12 березня 2022 р.). Сам Цукерберг неодноразово попадав під довжелезні судові процеси, і вони далеко не закінчені.
А технологічна полягає в самій збережності даних. Ну добре, я роблю періодичні бекапи - бо постійно ходжу на межі бана - а мільйони і мільярди інших користувачів (в FB 2,2 млрд. активних користувачів, єслічо)? Ось вам статистика. Щодня Facebook мусить зберегти додатково біля 4 петабайтів інформації (1 петабайт - мільйон гігабайт, приблизно як 600 млн. книжок середньої товщини), більше обробляє хіба що комплекс Великого Адронного Коллайдера (15 петабайт на експеримент). Як така кошмарна цифра утворюється? За підрахунками аналітичної компанії Bernard Marr & Co щодня в Фейсбуці реєструється 400 нових аккаунтів. Щодня завантажується 300 млн. фотографій (загалом кожен юзер постить по 10 картинок на день, включно із мемасиками в коментах - так що реально ця цифра куди більша). Щохвилини викладається 510 тис. коментів і 293 тис. постів. До цього слід додати ще порядка 16 млн. текстових повідомлень через месенджери на день. Навіть якщо врахувати, що Facebook щоквартально видаляє порядка півмільйона аккаунтів по класифікатору (ботоферми, порушення Правил Спільноти і просто "за компанію", випадки ми всі знаємо) - все одно кількість даних, які викладають користувачі щодня, астрономічна. Її треба десь зберігати.
Вище я назвав межу аудиторії, яка потрібна для того, щоб українська соціальна мережа змогла реально конкурувати із існуючими. Я нагадаю її - 600 тис. активних юзерів. Давайте прикинемо, який для цього необхідний обсяг сховища. 10 картинок на день дає в середньому 15 Мб (1,5 Мб - середній розмір картинки в форматі PNG 1024 x 1024). Кількість коментів, які в день робить 1 юзер - порядка 300-330, отже, йдеться про 5 Мб на день (макс. розмір комента 8 тис. знаків, а 1 знак - 2 байти). Великі пости люди пишуть в середньому раз на 4 дні, і від 2 до 4 малих статусів на день, що дає нам додатково максимум 1 Мб (макс. розмір поста 63 тис. знаки, середній розмір малого статуса - 2 тис. знаків). Довжина ціє статті, якщо вам цікаво - 29,4 тис. знаків.
Отже, в день 1 користувач генеруватиме 21 Мб даних в цілому. Мало. Але за рік ця цифра становитиме - 365 x 21 = 7665 Мб, тобто, 7,4 гігабайти даних. Тобто, на одну людину хостинг соцмережі має передбачити 7,6 Гб даних на рік (плюс 0,2 гіга на піковий випадок). А максимальний обсяг бізнес-хостинга в Україні (для фізособи) становить всього 144 Гб. Це ставить хрест на будь-яких незалежних розробках соцмережі "своїми силами", бо максимальна кількість юзерів буде обмежена 10-20 особами. Для тестування движка нормально, а ось для запуска соцмережі цього не те що недостатньо, а це все одно що на Місяць летіти, махаючи руками. Колись приблизно на такі ж цифри та висновки я вийшов чисто практично, коли адміністрував невеличкий "клубний" сайт.
Для "пробиття скляної стелі аудиторії соцмережі" буде необхідний датацентр із щорічним ростом хостингу на 4,5 петабайти (не забудемо, у ФБ такий ріст ЩОДНЯ) - із урахунком можливого пікового навантаження, бо всі ми пам'ятаємо, що відбувається у випадку значущих подій - всі різко починають постити, реагувати, і звичайно, сваритись і сратися. Саме тому, до речі - це "секрет Полішинеля" - на початкових етапах запуску Facebook Марк Цукерберг всіляко тормозив ріст кількості користувачів, навіть ризикуючи втратою довіри інвесторів, аж поки не добився випереджуючого роста обсягів хостинга - саме тоді і відбувся глобальний, вибухоподібний бум на Facebook.
Переводячи в матеріальну площину, йдеться про тисячу звичайних "винтів", які треба просто щороку ставити в стойку. Один такий жорсткий диск в найдешевшій категорії коштує 4,5 тис. грн. (а краще все-таки брати щось понадійніше).
Отже, "мінімальна ціна входу" хоча б на український ринок соцмереж, із орендованим приміщенням під датацентр, уже готовим движком і командою модераторів - 4,5 млн. грн., або 119 тис. дол. Якщо рік-два протримались, тоді можна уже сподіватись на якісь інвестиції.
... невже все так погано, і надії нема? Ні, надія завжди є.
Facebook, давайте будемо говорити чесно, надзвичайно далекий від досконалості. На сьогодні він експлуатує все ті ж самі ідеї та підходи, які в нього закладались двадцять років тому. Він навіть технологічно в ряді аспектів так і залишився в часах Internet 1.0. Спробуйте, наприклад, оформити свій пост різними шрифтами, чи вставити картинки не після тексту, а безпосередньо в ньому. А ці можливості закладено в стандарти HTML ще 20 років тому, з тих часів уже два рази стандарт оновлювався в бік ще більшої комплексності контента. Той, хто дасть користувачу можливість піти від "лінійного текста" і хоча б забезпечить елементарну гіпертекстуальність (від терміна "гіпертекст") життєписа - уже отримає ключову перевагу над Facebook.
Однак це не головне. Необхідно придумати ключову ідею, навколо якої буде збудована соцмережа. Знаєте, яка була ключова ідея Facebook? Я про це уже натякав. Готові? ІНТЕРАКТИВНИЙ ФОТОАЛЬБОМ. Ага, зараз це смішно читається, а однокашники Цукерберга пригадують, що на початку він від свого дітища вимагав лише двох речей - "більше фоток і швидкодії".
Але про ідеї, цілі та архітектуру соцмереж в цю статтю уже не влізе - про це ми поговоримо наступного разу.