Когда надоедает писать тексты…
Многие копирайтеры утверждают, что специализация – это наше всё! Без специализации дальше «ремесленника» не пойдёшь...
Но, ведь мы же не только копирайтингом круглосуточно занимаемся. Некоторые из нас сидят с детьми (копирайтер-мама – это весьма распространённое явление), кто-то работает ещё и в оффлайне. А кому-то просто хочется иногда «размяться» и он занимается физическим трудом. А иногда и совершенно невероятными вещами занимаются люди. Например, корректировкой огромных массивов запросов.
Я вот на выходных обрабатывала файлы Excel. Задача состоит в следующем: после выгрузки из бухгалтерской программы наименования товаров имеют ужасный вид, который не очень похож на запросы для поисковых систем. А нужно сделать именно запросы, под которые потом будут писаться статьи, то есть убрать «лишние» и служебные символы, оставив таким образом только текст. К примеру: было – «reward toys кукла чебурашка из м/ф (1971 г) средний с цветком», а сделать нужно – «игрушка мягкая reward toys кукла чебурашка из мультфильма средний с цветком», и так пятьдесят тысяч раз!!!
Понятно, что без автоматизации – ну, просто никак! Удаление служебных символов реализовано очень просто через поиск и замену на пробел, удаление повторов (а такое встречалось сплошь и рядом) по тому же принципу. То есть если были «часы часы Casio», то я искала сочетание «часы часы» и заменял на «часы». Иногда нужно было добавлять тип товара к ячейке. Это я реализовала с помощью объединения ячеек. То есть, если в ячейке B421 находится значение «reward toys кукла чебурашка из м/ф (1971 г) средний с цветком», то в ячейку C421 я вписывала формулу «=”игрушка мягкая” B421», в итоге я получала в ячейку C421 требуемое мне значение с типом товара именно вначале ячейки.
Ну и самое нудное (но реализованное достаточно просто) было искать повторы. Я сделала так: просто отсортировала всю таблицу в порядке возрастания/убывания требуемого набора столбцов (которые должны не повторяться), и дубликаты стали рядом.
Далее я создала столбец с формулой «=ЕСЛИ(ячейка=ячейка_над_нею,1,0)», отфильтровав (или отсортировав) этот столбец по 1 – я получаю дубликаты, которые выделяю сразу все и удаляю.
Всё!!!
p.s. Если потом нужно вернуться к первоначальному порядку строк – тогда заранее создаем еще один столбец с нарастающими значениями 1,2,3,4,... (т.е. «вторичный индекс», если терминами БД говорить).
Правда «p.s.» я придумала только после того, как сделала удаление дубликатов.
Изображение с pixabay.com