601    7    0  

Uforklarlig oppførsel på nett

 3,587     0
Våknet opp lørdag til død PC - og i sikringsskapet var sikringen slått ut. Jeg trakk ut alt på denne kursen, og plugget inn apparater én etter en. Da jeg kom til PCen slo sikringen ut på nytt. Jeg er ikke vant med at strømforsyninger går dukken på den måten! At de dør, javel, men ikke at de korslutter på inngangen!

Jeg hadde en reserve strømforsyning, og kom meg ut på nett, sånn til en viss grad ihvertfall... Noen nettsteder gikk helt greit, som tu.no og vg.no. byggebolig.no fikk opp oversikten over nye innlegg helt greit, men ble aldri ferdig med å hente profilen min. Adressa.no hentet teksten på forsiden kjapt, men i bildene kunne jeg omtrent telle enkeltpikslene etterhvert som de dukket opp. Slik var det med en rekke andre nettesteder også - Google bare ga opp. Men telefonkatalogen.no kom, smått om senn...

Jeg tenkte at her måtte det være en uforsiktig gravemaskinfører som hadde revet av en bunt på 960 fibre, eller noe sånt. Så jeg forsøkte først ping, dererett tracert mot en del nettsteder. 5-15 ms på de første tre-fire hoppene, gjerne ned til Oslo, og etter det: Timeout. Gjengatte ganger, til ulike nettsteder: Normal respons i 3-4 hopp, og så er det slutt. Da måtte vel hele nett-Norge være i sjokk, hvis en av de store nix-ene hadde fått kuttet sine linjer?? Men ingen sa et ord i nyhetsmeldingene, ikke et ord var å lese i de aviser og tekniske nettsteder jeg fikk respons fra.

Jeg kjørte en speedtest: 102 Mbps download - det var ikke min nettforbindelse som var blitt erstattet med morsenøkkel. Men det var for download... upload-testen terminerte aldri!

Så jeg kontaktet Altibox support. Mannen kjente ikke til noen problemer i nettet, og fikk 'normal' kontakt med alle de nettstedene som ikke ville kommunisere med min PC. Han kjørte alle de testene mot min linje som han hadde tilgjengelig, uten å finne noe. Mannen foreslo at vi som et første steg i videre feilsøking resatte nettverktermineringen ('sentralen' er hva NTE-folkene kaller den) til fabrikks-instillinger. Jeg små-lo litt av det: Når alt fungerer tilnærmet normalt mot noen nettsteder, men ikke mot andre, og det tydeligvis skjer noe etter 3-4 hopp, da er det neppe noen feil i mitt utstyr! Men det er greit for meg, selv om jeg ikke tror noe på det!

Sentralen ble resatt, og med det samme den var i gang igjen fungerte alt helt perfekt .

Hææææ?

Jeg har bare jobbet med datanett på protokoll-nivå (og selv det er lenge siden), har bare unntaksvis sett grundigere på rutere og lignende bokser på nærmere hold enn hva enhver vanlig bruker gjør; jeg har ikke særlig intimt forhold til dem. Er det noen rundt her som har arbeidet med slike saker i praksis, på feilsøkingsnivå, og kan komme med noe som ligner en plausibel teknisk forklaring på oppførselen?

Nå i ettertid begynner jeg å tenke på en gammen historie - http://www.ibiblio.org/harris/500milemail.html, "The case of the 500 mile email". (Mrk: Du må være ganske mye IT-person for å skjønne hva som foregår her; historien slår ikke gjennom i cocktailparties...). Kan det hende at det jeg opplevde var ett eller annet i samme gate, en effekt av en nullstilling av en eller annen verdi i sentralen min?

Siden det skjedde samtidig, var det antagelig samme bakenforliggende årsak til at sentralen måtte resettes og at strømforsyningen tok kvelden. Det er nærliggende å mistenke en spenningspuls på nettet (det kan ha vært tordenvær mens jeg sov). Men, 'for the record': PCen sto beskyttet bak et FG-godkjent overspenningsvern, sentralen gjorde det ikke. For sentralen holdt det med en resetting, strømforsyningen var fatalt knekt!

Maskin og nett er oppe igjen nå og (ihvertfall tilsynelatende) friske, men jeg skulle gjerne hatt en forklaring på oppførselen likevel!

   #1
 5,569     0
Når jeg opplever slikt forsøker jeg alltid (først) en annen nettleser, så telefonen mot de samme sidene. Veldig ofte er det min egen nettleser som kødder det til.

Anyway, 500 mile email var glimrende! Grin
   #2
 1,699     Trondheim     0
Kan være mye rart. Trenger ikke å være verre enn at softwaren i ruteren har hengt seg opp pga. en uventet situasjon og dermed ikke har å prosessesere forespørsler på skikkelig vis.
Restarten resatte alt og det funker fint igjen.
Eksempelvis at maskinen din sendte ut noen kryptiske nettverkssignaler før den tok kvelden som fikk ruteren til å få hikke, gå i uendelig loop for å ta imot noe som aldri kom eller noe slikt. MYE programvare som ikke tar hensyn til særtilfeller som skjer, og selv om det selvsagt ikke bør/skal skje så er det umulig å teste alle for alle mulige situasjoner.

Og +1 for 500 miles historien. Rett og slett hærlig!
Signatur
  (trådstarter)
   #3
 3,587     0
Jo, men siden strømmen forsvant fra sentralen i og med at sikringen knakk, fikk den en normal reboot som følge av det (og siden jeg måtte prøve meg fram for å finne hva som knakk sikringen, fikk sentralen to re-bootinger!). En uendelig løkke ville bli brutt av en reboot. Det var ett eller annet i det permanente oppsettet, det som overlever en reboot, som gjorde at sentralen (f.eks.) på nytt gikk inn i samme uendelige løkke etter en reboot.
Det som måtte til var en 'factory reset' til for å stoppe den oppførselen. Og det synes jeg er litt snodig, for å si det sånn.

Det er selvsagt fullt mulig at dette er 100% avhengig av hvilken modell sentral jeg har, at det er elendig boot-time handtering av nullstilte registre i akkurat denne modellen (ZyXEL P2812ac). Så jeg tenkte kanskje noen kunne fortelle noe i retning av at 'ja det er et kjent problem i ZyXEL-serien at hvis timer T43 ikke er intialisert til en fornuftig verdi vil mottaket svikte dersom svaret kommer mer enn 22 ms etter at forespørselen er sendt', eller noe i den gata (jfr. the 500 mile email). Min ZyXEL-modell må vel kalles 'ganske standard', så det kan jo være et kjent problem.
GR
   #4
 794     Rogaland     0
Kan vel ikke se helt bort fra at routeren gjør noen grep under en kontrollert shutdown/reboot som du ikke gjorde når sikringen gikk to ganger. Kan hende den gjør en eller annen form for tømming av cache for routingtabeller, macadresser eller hvem vet hva.

At noe virket og annet ikke kan kanskje være etter om noe har blitt routet om eller hvem vet... Eller kanskje den gikk i full overload på grunn av en bootefeil/systemfeil på grunn av korrupt lager/fil etter hard shutdown, og full reset ordna opp i det. Det kan forklare piksel for piksel.
   #5
 5,111     Sørnorge     0
Mest sannsynlig har altibox endret noe i sitt nett og distribuert endringene til sine kundeplasserte bokser mens din boks manglet strøm. Dermed fikk den ikke med seg dette. Factory reset av altibox-boksen medfører at den laster ned ny config fra altibox.

Oppførselen du beskriver kan f.eks opptre dersom en routingprotokoll/parameter ikke riktig. Det kan være BGP, noen DHCP parametere, eller endring av vlan. Jeg vil tippe de har tenkt å fase ut en av sine lokale routere og derfor har satt opp en ny parallelt, distribuert denne til alle kunder via dhcp, og så i den tro at alle kunders bokser har fått med seg dette, endret routing internt. Din boks som ikke hadde fått med seg dette sendte pakker til den gamle routeren, som sendte videre som før, men kom til et punkt hvor returroutingen gikk en annen vei og noen anti-spoofing mekanismer slo inn og stoppet trafikken.

Selv har jeg latt altibox-boksen ligge i boksen sin på hylla og lar mikrotiken ta seg av alt nett her i huset. Grunnen til det er at da altibox kom for å bytte ut den gamle boksen sin med en ny, viste den nye seg å være en Zyxel av samme type som telenor bruker. Denne har en tendens til å bli ustabil etter noen måneders bruk. Jeg reiser mye og er avhengig av å kunne logge meg på hjemme. Derfor kunne jeg ikke ta risikoen med å ha en ustabil boks i nettet hjemme.
  (trådstarter)
   #6
 3,587     0
En liten hale på denne historien...

Det er noe som heter 'If you can't hide it, tell it!' Jeg kunne vel holdt det skjult, men lar det stå til:

Høyst sannsynligvis var det en spenningspuls på nettet som både knakk strømforsyningen til PCen og forstyrret 'sentralen' min (som NTE liker å kalle det). Egentlig var jeg litt skuffet over at ikke overspennings-vernet hadde beskyttet PC-en; da jeg kjøpte det i fjor var det den eneste modellen som var godkjent av FG, Forsikringsselskapenes Godkjenningsnemnd. Boksen står i stua rett bak PC-en, og 'sentralen' i kjelleren er ikke beskyttet.

Da jeg ryddet i lednings-spaghettien i går... Det er flaut å si det: Da oppdaget jeg at PC-en var plugget rett inn i veggen, ikke via overpsenningsvernet. Da var jeg glad for at skaden ikke var så stor at jeg hadde kontaktet forsikringsselskapet.

Jeg har ingen rasjonell forklaring på hvorfor alt det andre datautstyret var plugget inn i overspenningsvernet, men ikke PC-en selv.
   #7
 24,668     Akershus     0
Vet ikke nøyaktig hva som er i et slikt overspenningsvern, men ser ikke bort fra at det ikke betyr så mye om vernet står før eller etter PC, bare de står nær hverandre.

Vernet kan være et gnistgap eller varistor. Da har det neppe noen stor betydning. Hvis det også inneholder spoler kan det derimot være kritisk at beskyttet utstyr står etter.
Signatur