Dec 21 2004
Трябва ли й на 8 процесорна машина hypertreading?
Тъп въпрос, нали? Оказа се, че й трябва. Машината е eServer x445, 8GB RAM, 8 х Xeon 2.7GHz, 2 x HBA Qlogic 2312 (fiber).
Инсталирах й Advanced Server-a на RedHat, защото това е препоръчителната ОС за Oracle. Не че не може да стане и с други дистрибуции, но като видях на какво прилича Universal Installer-a, колко кръпки и дупки има по време на самата инсталация (Ignore на грешки, пачове “в движение” и т.н.), направо се поздравих за избора на опрационната система. В самата документация има всичко подробно и точно описано. Доста добро “доку”, беше писано от RH инженер, който явно си е разбирал от работата.
Странностите започнаха, след самата инсталация на RedHat-a. Не можеше да се бутне многопроцесорното ядро (2.4.21), ами само еднопроцесорното такова (спираше до качването на драйверите на дисковият контролер). Не ти трябва да си Шерлок Холмс, а по-скоро Уотсън, за да се сетиш, че има нещо около процесорите. Грешната грешка в случая и в последствие изгубените 3 часа, дойдоха от това, че машината забиваше на зареждането на драйверите на RAID контролера и то със съобщение от вида timeout.
В крайна сметка не останаха много възможности за проби и грешки. Подробният преглед на BIOS-a и по-специално настройките на процесора показаха, че е забранен hipertreading-a. Спомних си, че това го направиха образите от фирмата доставчик. Тогава на моят въпрос “Що бе?”, съответно получих професионалният контра-въпрос “За какво й е на 8 процесорна машина hipertreading?”. Кой не би си млъкнал, кой не би спрял да пита? Още повече пък аз, който съм изключително скромен и кротък човек ![]()
След активирането на въпросният hipertreading всичко си дойде на мястото. Е, ядовете и проблемите продължават, но всичко по реда си. Сега е наред оптичната библиотека (TotalStorage FAStT600, 14 x 73G HDD), която трябва да се свърже към този сървър. При нея грижите идват, когато се създаде втори дисков масив - той посмъртно не се вижда от Qlogic контролерите. Ако логическият масив е само един, всичко си е ОК, монтира се и си работи, като оса (вижда се, като /dev/sdb). Странното е, че вторият масив, който би трябвало да се вижда, като /dev/sdc всъщност “дублира” /dev/sdb (все едно две еднакви устройства). Това е някакво перверзно разбиране на fail-over функциите на контролерите.
Като всяка маркова техника и тази си има перфектна документация - все пак IBM си имат отколешни традиции в тази област, само дето нищо полезно не мога да видя там. Излиза, че май пак проблемът е в пред-клавиатурното устройсто.
Нищо де, има още за четене - няма начин “да няма начин” ![]()

