Язык программирования Ruby набирает популярность день ото дня. Его главное преимущество заключается в скорости разработки. В среднем она на 30-40% выше, чем при использовании других языков программирования и базирующихся на них фреймворков.
Увеличение скорости разработки достигается за счет наличия обширного набора штатных инструментов. Кроме того, активное сообщество программистов постоянно пополняет базу готовых решений (ruby gems), вследствие чего различные этапы разработки существенно облегчаются.
Впрочем, случаи, когда сервисы с Rails переписываются на других языках, весьма распространены. Так twitter был переписан на Scala, iron.io на Go и т.д. В этой связи, у нас возник один интересный вопрос. Обязательно ли переписывать все приложение? Ведь, по сути, не всегда именно скорость языка становится тем самым “бутылочным горлышком”. В этой роли может выступать, например, база данных или что-то еще.
Итак, мы задались вопросом: а можно ли выделить в приложении такие места, где скорость работы упирается в производительность Ruby и переписать только их, используя высокопроизводительный язык Go? При этом за исключением выбранных мест, код должен оставаться в оригинальном виде. Итак, на повестке дня Ruby и Go Lang.
Реальный пример
Чтобы продемонстрировать преимущества Go на реальном примере, мы будем использовать построение «матрешки» ключевых слов. Это метод позволяет преобразовывать логические связи в многословные низкочастотные запросы из отдельного набора высокочастотных (а значит, более конкурентных) слов. Как известно, низкочастотники требуют меньших усилий для продвижения в поисковых системах. Перед вами пример построения ключа-матрешки:
Какие же результаты мы получили после добавления Go вставки:
- 7000 слов: Ruby — 60 ms, Go – 150 ms;
- 17000 слов: Ruby – 6 min, Go – 3 min 43 sec;
- 64000 слов: Ruby – 15 min, Gо – 7 min.
Очевидно, что колоссальный выигрыш в производительности становится заметен при большом объеме данных. Однако глядя на первый пример, становится понятным, что преобразование входных и выходных данных с использованием Go наоборот заняло больше времени. Дело в том, что поставленная перед нами задача не поддается “распараллеливанию”. Если бы данные обрабатывались параллельно, то разница между языками была не столь существенной. Напрашивается вывод: использование выбранного нами метода зависит от конкретно поставленной задачи.
Техническая сторона вопроса
Связать RoR и Go оказалось довольно просто. Для этого нам понадобился гем quartz, который устанавливается в качестве гема в Ruby, а в Go – в качестве плагина. Для обмена данными они используют UNIX сокет, передавая их в JSON формате.
Теперь же перейдем к технической стороне описываемого метода вплотную:
Настройка в Go:
go get github.com/DavidHuie/quartz/go/quartz
Добавляем его в вызываемый скрипт:
import («github.com/DavidHuie/quartz/go/quartz»)
Настройка в Ruby:
gem install quartz
require ‘quartz’
Реализация RPC-сервера на Go
Так как Go вызывается из Ruby, нам нужен способ обмена данными. Quartz позволяет реализовать RPC-сервер для обработки сообщений из Ruby.
Для этого нам необходимо определить следующие объекты:
- resolver;
- arguments;
- response.
- Resolver — объект, содержащий методы, которые будут выполняться извне
- Arguments — описывает входящие аргументы;
- Response — описывает полученный результат.
Программа на Go будет выглядеть примерно следующим образом:
Вызываем удаленные процедуры из Ruby:
Пример кода на Go для построения матрешки ключевых слов:
Код на Ruby – это закоментированный код. То есть реализация Go-алгоритма:
В заключение отметим, что предложенный вашему вниманию метод может значительно повысить производительность работы приложения и увеличить скорость обработки данных без необходимости полного переписывания существующего проекта. Согласитесь, перспектива весьма приятная и, что гораздо важнее — полезная.