MRTG часть 2 - восстание машин:)

Обсуждаем OS FreeBSD и сервисы на ней.

Re: MRTG часть 2 - восстание машин:)

Сообщение root » 13 окт 2011, 08:04

Андрей писал(а):Не дебажится.
Код: Выделить всё
nas# gdb /var/crash/vmcore.0


NAME
kgdb -- kernel debugger

SYNOPSIS
kgdb [-a | -f | -fullname] [-q | -quiet] [-v] [-w] [-d crashdir]
[-c core | -n dumpnr | -r device] [kernel [core]]


Код: Выделить всё
kgdb /boot/kernel/kernel /var/crash/vmcore.0

затем
Код: Выделить всё
bt


пример:
Код: Выделить всё
#kgdb /boot/kernel/kernel /var/crash/vmcore.3
(kgdb) bt
#0  doadump () at pcpu.h:223
#1  0xffffffff8038a3f9 in boot (howto=260) at ../../../kern/kern_shutdown.c:416
#2  0xffffffff8038a82c in panic (fmt=0xffffffff805c7444 "%s") at ../../../kern/kern_shutdown.c:590
#3  0xffffffff8055eef8 in trap_fatal (frame=0xffffff0001590000, eva=Variable "eva" is not available.
) at ../../../amd64/amd64/trap.c:777
#4  0xffffffff8055f2c4 in trap_pfault (frame=0xffffff80724f2470, usermode=0) at ../../../amd64/amd64/trap.c:693
#5  0xffffffff8055fb0a in trap (frame=0xffffff80724f2470) at ../../../amd64/amd64/trap.c:451
#6  0xffffffff805454d3 in calltrap () at ../../../amd64/amd64/exception.S:223
#7  0xffffffff803e4f87 in m_copym (m=0x0, off0=2980, len=1480, wait=1) at ../../../kern/uipc_mbuf.c:542
#8  0xffffffff8046e357 in ip_fragment (ip=0xffffff0040992a58, m_frag=0xffffff80724f2688, mtu=Variable "mtu" is not available.
) at ../../../netinet/ip_output.c:819
[b]#9  0xffffffff8046f3bf in ip_output (m=0xffffff0040992a00, opt=Variable "opt" is not available.[/b]
) at ../../../netinet/ip_output.c:650
...
(kgdb) frame [b]9[/b]
#9  0xffffffff8046f3bf in ip_output (m=0xffffff0040992a00, opt=Variable "opt" is not available.
) at ../../../netinet/ip_output.c:650
650             error = ip_fragment(ip, &m, mtu, ifp->if_hwassist, sw_csum);
(kgdb) p /x *ip
$1 = {ip_hl = 0x5, ip_v = 0x4, ip_tos = 0x0, [b]ip_len = 0xdc05[/b], ip_id = 0xaa5d, ip_off = 0x20, ip_ttl = 0x7a, [b]ip_p = 0x1[/b], ip_sum = 0xeac0, ip_src = {
   s_addr = [b]0x92aa1151[/b]}, ip_dst = {s_addr = [b]0x3ade553[/b]}}
(kgdb) x  /s ifp.if_xname
0xffffff0040167828:      "ng0"
С уважением, root

Изображение
------------
www.mega-net.ru - IT аутсорсинг
Аватара пользователя
root
Site Admin
 
Сообщения: 1894
Зарегистрирован: 11 июн 2008, 13:05
Откуда: Moscow, Russia

Re: MRTG часть 2 - восстание машин:)

Сообщение lehisnoe » 13 окт 2011, 09:18

Андрей писал(а):Не дебажится.

Прошу прощения, я лидирующую букву "k" пропустил - конечно же kgdb - речь-то шла о корке ядра (+1 к root):
root писал(а):kgdb -- kernel debugger
No users
No troubles
No money
------------
www.mega-net.ru - IT аутсорсинг
Аватара пользователя
lehisnoe
Site Admin
 
Сообщения: 539
Зарегистрирован: 11 июн 2008, 14:09
Откуда: Moscow

Re: MRTG часть 2 - восстание машин:)

Сообщение Андрей » 13 окт 2011, 09:26

root писал(а):kgdb /boot/kernel/kernel /var/crash/vmcore.0

А вот так не пробовал, хотя kgdb пробовал. ))
Вот такой вывод у меня получился:
Код: Выделить всё
kgdb /boot/kernel/kernel /var/crash/vmcore.0
GNU gdb 6.1.1 [FreeBSD]
Copyright 2004 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB.  Type "show warranty" for details.
This GDB was configured as "i386-marcel-freebsd"...(no debugging symbols found)...
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
#0  0xc086a63b in doadump ()
(kgdb) bt
#0  0xc086a63b in doadump ()
#1  0xc086abad in boot ()
#2  0xc086afde in panic ()
#3  0xc0ac7c59 in kmem_malloc ()
#4  0xc0ac062a in uma_large_malloc ()
#5  0xc0858238 in malloc ()
#6  0xc089f5b0 in sbuf_new ()
#7  0xc0908c16 in ifconf ()
#8  0xc090dc4c in ifioctl ()
#9  0xc08a7588 in kern_ioctl ()
#10 0xc08a78f0 in ioctl ()
#11 0xc0b9518a in syscall ()
#12 0xc0b77b70 in Xint0x80_syscall ()
#13 0x00000033 in ?? ()
Previous frame inner to this frame (corrupt stack?)


Код: Выделить всё
kgdb /boot/kernel/kernel /var/crash/vmcore.1
GNU gdb 6.1.1 [FreeBSD]
Copyright 2004 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB.  Type "show warranty" for details.
This GDB was configured as "i386-marcel-freebsd"...(no debugging symbols found)...
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
Attempt to extract a component of a value that is not a structure pointer.
#0  0xc086a63b in doadump ()
(kgdb) bt
#0  0xc086a63b in doadump ()
#1  0xc086abad in boot ()
#2  0xc086afde in panic ()
#3  0xc0ac7c59 in kmem_malloc ()
#4  0xc0ac062a in uma_large_malloc ()
#5  0xc0858238 in malloc ()
#6  0xc089f5b0 in sbuf_new ()
#7  0xc0908c16 in ifconf ()
#8  0xc090dc4c in ifioctl ()
#9  0xc08a7588 in kern_ioctl ()
#10 0xc08a78f0 in ioctl ()
#11 0xc0b9518a in syscall ()
#12 0xc0b77b70 in Xint0x80_syscall ()
#13 0x00000033 in ?? ()
Previous frame inner to this frame (corrupt stack?)


глюки железа?
.ı|ı..ı|ı.
Андрей
местный житель
 
Сообщения: 1028
Зарегистрирован: 14 янв 2009, 13:37
Откуда: Оренбургская область

Re: MRTG часть 2 - восстание машин:)

Сообщение lehisnoe » 14 окт 2011, 10:18

Андрей писал(а):глюки железа?
Не вижу оснований для таких выводов.
Пересобирай ядро с дебагом, смотри корку и только после этого можно делать какие-то выводы.
No users
No troubles
No money
------------
www.mega-net.ru - IT аутсорсинг
Аватара пользователя
lehisnoe
Site Admin
 
Сообщения: 539
Зарегистрирован: 11 июн 2008, 14:09
Откуда: Moscow

Re: MRTG часть 2 - восстание машин:)

Сообщение Андрей » 14 окт 2011, 15:47

Андрей писал(а):#13 0x00000033 in ?? ()
Previous frame inner to this frame (corrupt stack?)

Я думал в этом дело.
lehisnoe писал(а):Пересобирай ядро с дебагом, смотри корку и только после этого можно делать какие-то выводы.

Ну, как вариант. Сейчас изъял одну линейку памяти, посмотрю что будет дальше. Падает не каждый день, а примерно, раз в неделю - две.
.ı|ı..ı|ı.
Андрей
местный житель
 
Сообщения: 1028
Зарегистрирован: 14 янв 2009, 13:37
Откуда: Оренбургская область

Re: MRTG часть 2 - восстание машин:)

Сообщение Андрей » 12 дек 2011, 06:44

kmem_map malloc снова случился, но уже на второй машине. Проблема, в обоих случиях, была в первом случае в линейке памяти - на машине ОС x32, а установлено было более 4Гб памяти. Помогло изъятие линейки. Во втором случае отказ слота памяти или канала памяти. Проблема не тривиальна, но посоветую людям не лезть в доки по БСД и пересобирать ядро с непойми какими опциями, а просто проверить ОЗУ сервера.
.ı|ı..ı|ı.
Андрей
местный житель
 
Сообщения: 1028
Зарегистрирован: 14 янв 2009, 13:37
Откуда: Оренбургская область

Re: MRTG часть 2 - восстание машин:)

Сообщение lehisnoe » 12 дек 2011, 20:44

Могу порекомендовать только не юзать:
    - "gamer's choice" железо для серверных задач;
    - непроверенное стресс тестами серверное б/у железо.

У нас за лет семь-восемь практики работы с mrtg ни разу вышеописанных ситуаций не случалось.
No users
No troubles
No money
------------
www.mega-net.ru - IT аутсорсинг
Аватара пользователя
lehisnoe
Site Admin
 
Сообщения: 539
Зарегистрирован: 11 июн 2008, 14:09
Откуда: Moscow

Re: MRTG часть 2 - восстание машин:)

Сообщение Андрей » 13 дек 2011, 12:32

Железо новое, было. Год всего отработало, даже чуть меньше.
Именно серверный вариант, т.к. сам настаивают не использовать десктопные варианты.
.ı|ı..ı|ı.
Андрей
местный житель
 
Сообщения: 1028
Зарегистрирован: 14 янв 2009, 13:37
Откуда: Оренбургская область

Пред.

Вернуться в FreeBSD

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 22

cron