Производство гидро и иммерсионных систем охлаждения асик майнеров для центров обработки данных

Подготовка оборудования к работе в однофазной системе иммерсионного охлаждения


Внимание! Нижеприведенные рекомендации ориентированы на пользователей, имеющих опыт сборки/разборки/очистки оборудования. Если у вас такого опыта нет, то эти рекомендации следует отдать сервисному специалисту, который будет готовить ваше оборудование к погружению в установку иммерсионного охлаждения. Либо быть готовым к разного рода неожиданностям.

 

Вы приобрели установку, предназначенную для однофазного иммерсионного охлаждения оборудования, и в паспорте установки написано, сколько и какого типа оборудования (АСИКов или других серверных единиц) вы можете в эту установку погрузить. Не стоит пренебрегать этим описанием, поскольку неаккуратная подготовка, использование других моделей оборудования, не перечисленных в паспорте установки, попытки погрузить больше оборудования, чем имеется слотов, и прочие эксперименты приведут к порче и негарантийным случаям выхода из строя как самой установки, так и эксплуатируемого оборудования.


Оборудование для установки может быть как новым, так и побывавшим в употреблении, и процесс подготовки для этих двух категорий разный.

 

Подготовка нового оборудования

1.     Разбираем оборудование. В случае АСИКа отсоединяем всё до извлечения хэш-плат. Внимательно осматриваем  хэш-платы. Если замечаем следы флюса, и/или не засыхающей термопасты, то плату следует как минимум очистить, как максимум заменить термопасту на более вязкую и быстросохнущую (см. раздел про замену термопасты).

2.     Если на предыдущем шаге пришлось заменить термопасту, нужно собрать АСИК, включить его примерно на час, убедиться, что он работает, и паста высохла.

3.     Прошивка. Прошить и убедиться, что корректно работает.

4.     Разбираем оборудование и снимаем все вентиляторы. Важно! Даже если вы после разборки на первом шаге не нашли никакого криминала, важно собрать, включить, прошить, убедиться что работает, и только после этого приступить к разборке и снятию вентиляторов. При необходимости (зависит от типа оборудования) после снятия вентиляторов устанавливаем обманки. В некоторых моделях АСИКов обманка требуется в том числе и на блок питания.  Если прошивка позволяет отключить проверку вентиляторов, то устанавливать обманки вместо вентиляторов не нужно.

5.     Погружаем оборудование в подготовленную установку в соответствии с инструкцией.

 

Подготовка оборудования, бывшего в употреблениии.

1.     Разбираем. Если визуальный осмотр не показывает сильного загрязнения, можно ограничиться продувкой воздушным компрессором. Если загрязнения сильные, то сначала следует продуть компрессором, затем вымыть теплой водой с добавлением бытового моющего средства. Можно использовать посудомоечную машину, стиральную нельзя. Если степень загрязнения зашкаливает, снимаем радиаторы типа plate, промываем в ультразвуковой машине, сушим, ставим радиаторы на новую термопасту, собираем как для работы на воздухе.

2.     Если оборудование пришло из ремонта, внимательно проверяем на следы флюса, особенно если ремонт был не гарантийный, не от производителя, и вы не уверены на 100% в его качестве. Убираем следы флюса, для этого можно использовать например, спрей-очиститель Flux-off или аналоги. Еще одна ситуация, которая может возникнуть после ремонта АСИКов, это отказ оборудования, если в ходе ремонта радиаторы на чип не напаивают, а приклеивают. На воздухе такое соединение держится, в иммерсионной жидкости – разрушается.

3.     Прошивка. Как и в предыдущем алгоритме, нужно прошить, и убедиться, что все  корректно работает. Если нужно подсушить термопасту, включаем и ждем примерно час. Установка кастомных прошивок производится строго в соответствии с рекомендациями разработчика прошивки. Кастомная прошивка надежного разработчика должна обеспечивать следующий набор "Джентельменских качеств" - Специально разработанный  "иммерсионный" режим работы, включая возможность отключения проверки вентиляторов,  дополнительную защиту от перегрева чипов, возможность безопасного разгона или даунвольта оборудования. Некоторые виды прошивок могут иметь дополнительные требования к работе оборудования в иммерсионном режиме. В этом случае строго следуйте руководству по установке и использовании прошивки.  

6.     Если АСИК после прошивки и сушки корректно работает, разбираем, снимаем вентиляторы. При необходимости (зависит от типа оборудования и используемой прошивки) после снятия вентиляторов устанавливаем обманки. В некоторых моделях АСИКов обманка либо отдельная прошивка требуется в том числе и на блок питания.  Если прошивка позволяет отключить проверку вентиляторов ( имеет иммерсионный режим ) , то устанавливать обманки вместо вентиляторов не нужно.

4.     Погружаем оборудование в подготовленную установку в соответствии с инструкцией.  

 

Подготовка оборудования практически во всем подчиняется законам Мёрфи, основной из которых звучит так: «Если что-то может пойти не так, оно пойдет не так».  Поэтому ниже перечислены несколько основных принципов работы с оборудованием, которые следует запомнить и неукоснительно их придерживаться.

 

1.     Даже если раньше оборудование работало, не факт, что после разборки/продувки/чистки/сборки оно заработает. При всех этих операциях можно повредить какой-нибудь контакт, что-то неправильно собрать или включить. Поэтому ВАЖНО каждый раз после любого шага удостовериться в корректной работе оборудования. Иначе вы погрузите оборудование, а оно у вас не включится/не заработает/замкнет, и процесс очистки его от иммерсионного масла для того, чтобы выполнить все вышеперечисленные операции, или того хуже ремонт, займет существенно больше времени и сил.

2.     Во время чистки б/ушного оборудования могут проявиться скрытые дефекты, которые потребуют компонентного ремонта, и это будет стоит дополнительных денег. Этого не нужно пугаться, к этому нужно быть готовым.

3.     Если оборудование пришло из ремонта, не факт, что оно корректно заработает (см. выше про разницу в припаянных и наклеенных радиаторах), нужно все тщательно ПРОВЕРЯТЬ

4.     Обязательно нужно проверять корректность работы прошивки, потому что вследствие некорректной работы могут разрушиться микропрограммы в платах, и придется брать другую прошивку, ее устанавливать, восстанавливать работу микропрограмм и т.п. И лучше это делать на столе, чем в установке.

5.     Для любого оборудования действует правило: перед снятием вентиляторов и погружением УБЕДИТЕСЬ, что оборудование включается, майнинговый процесс на нем запускается, прошивка работает.

6.     Если оборудование не просто б/у, а работало перед этим в установке иммерсионного охлаждения другого производителя, его ОБЯЗАТЕЛЬНО нужно промыть, чтобы убрать любые оставшиеся следы предыдущего погружения.  Просто включить оборудование, побывавшее в установке и не отмытое от иммерсионной жидкости нельзя – на него налипает пыль, и это приводит к нарушению штатной работы, вплоть до замыкания.

7.     Если оборудование раньше эксплуатировалось в установке Октава, и было изъято с целью ремонта, сервисного обслуживания, апгрейда, то обязательно перед погружением ПРОВЕРИТЬ его работоспособность по алгоритму выше. А если оборудование долго находилось в ремонте, и при этом какая-то часть его не эксплуатировалась в установке, находясь на воздухе, то во-первых, содержать ее надо в закрытом контейнере, чтобы максимально оградить от загрязнений, во-вторых, обязательно ПРОВЕРИТЬ по алгоритму перед погружением.

8.     90% дефектов, выявляемых при сборке/разборке/очистке оборудования достаточно легко устраняются. Не нужно по этому поводу переживать, нужно быть к этому морально готовым.

9.     При производстве АСИКов далеко не всегда выдерживаются стандарты качества сборки, поэтому ситуации, когда оборудование, только что работавшее у поставщика, у вас внезапно перестало работать – к сожалению, не так уж редки. Как правило, все поправимо, НО чтобы минимизировать неприятности, вашим кредо должна стать тщательная подготовка и проверка оборудования на всех стадиях его жизненного цикла.