woensdag 31 augustus 2011

Alternatives to ... kladblok

Precies omdat andere programma's zo complex en lomp worden, is kladblok vaak zeer handig en zelfs de redder in nood. Maar er zijn toch een aantal andere programma's die mooie extra's toevoegen en toch eenvoudig blijven:
  • [Notepad++] Gebruik ik op dit moment. Bevat alle nodige functies en woordenboeken voor elke programmeertaal.
  • [Crimson Editor] Gebruik ik niet meer omdat het niet meer vernieuwd wordt.
  • [Textpad] Is een sterk programma, maar toont af en toe pop ups tot je betaalt.
  • [ConTEXT] Geïnstalleerd maar ik gebruikte het niet.
  • [Bluefish] Heb ik geïnstalleerd maar het werkt niet. Zou goed moeten zijn om online bestanden in webformaten aan te passen.
Ze laten toe reguliere expressies te gebruiken voor zoek- en vervangopdrachten, bieden syntax highlighting voor veel programmeertalen, openen bestanden in tabs, werken deze bij als ze in een ander programma werden gewijzigd en hebben een blokselecteerfunctie.

Voorbeeld van het gebruik van reguliere expressies:
http://www.ozzu.com/mswindows-forum/repalce-character-with-carriage-return-line-feed-t56436.html

Als je denkt als een typemachine is de newline instructie \n\l eenvoudig:

  • \n vraagt een nieuwe lijn
  • \r zet de cursor terug bij het begin van de lijn (return)

Stata and graphics

Although the graphs aren't really flashy, Stata is quite good in generating graphical output and automatizing the proces. There is a vaste array of possible graphs to choose from. Below are some links.
For variations on the histogram command, try:
  • byhist
  • catplot
  • tabplot
  • spineplot
  • simple bar graphs, provided you bin and collapse variables first yourself

Stata, ranks and quantiles

I'm a huge fan of Stata, largely preferring the program over SPSS for almost everything, even graphics and tables. Yet ranks and quantiles are quite awkward. The commands needed are:

rank() - using egen, watch out for the order
xtile - basic program included in the software (Stata 11)
xtile2 - permits by-variables, to be installed

Office 2007, pdf's en algebra

Wanneer "vreemde en complexe" lettertypes niet geïnstalleerd zijn, zal de functie 'opslaan als pdf' in de Office-programma's niet werken. Oplossing: print met een pdf-printer (pdf995) of installeer de lettertypes.

httpBericht publiceren://help.lockergnome.com/office/Problems-equations-Word-2007--ftopict943892.html

Factoranalyse

Een zeer korte handleiding voor factoranalyse:

Waarom factoranalyse

Factoranalyse is een datareductiemethode, waarbij gezocht wordt naar latente variabelen die een set van variabelen samenvatten. Het vertrekt daarom van de correlatiematrix van deze geobserveerde variabelen.

Voorbeeld: leerlingen leggen op het eind van het jaar twaalf testen af. Een exploratieve factoranalyse zou aan het licht kunnen brengen dat dit eigenlijk slechts drie vaardigheden toetst.

  1. Taalvakken: Nederlands, Frans, Engels, Duits
  2. Analytische vakken: wiskunde, natuurkunde, scheikunde, logica
  3. Kennisvakken: geografie, biologie, geschiedenis, esthetica
Een confirmatorische factoranalyse werk op de omgekeerde manier: 

Let op!


  • Controleer eerst de correlatiematrix: enkel variabelen die een correlatie boven .30 met andere variabelen hebben dienen te worden weerhouden.
  • Gebruik geen factoranalyse als de correlatie tussen variabelen niet aan een latente factor te wijten is maar bijvoorbeeld aan de distributie van de populatie op irrelevante kenmerken.

Scree plot



Assumpties
Dezelfde als voor correlaties: normaal verdeelde, continue variabelen. Heb je ook of enkel ordinale of binaire data, dan moet je vluchten naar polychorische principale componentenanalyse (het trage en onoverzichtelijke polychoricpca in Stata of de complexe explorative factoranalyse in Mplus).

Eigenwaardes
Als een vuistregel gebruikt men Kaisers criterium (Kaiser's criterion) dat zegt dat eigenwaardes groter dan 1 moeten zijn. Alternatief kan je kijken naar relatieve sterke dalingen van de eigenwaarde, naar de cumulatieve voorspelde variantie, naar de factorsterkte (Mplus: > .9) of naar bepaalde significantiematen (Mplus: RMSE). 

Rotatie
Om de geobserveerde variabelen te scoren op een bepaalde matrix zijn er verschillende mogelijkheden. Orthogonale rotaties of oblique rotaties. Voor zover ik het begrijp zijn de dimensies in een orthogonale rotatie niet gecorreleerd (denk aan een kruis met rechte hoeken), terwijl dit in oblique rotaties wel het geval is (een kruis met scherpe en stompe hoeken). De vergelijking met kruisen gaat natuurlijk enkel op in twee- of driedimensionele omgevingen. De richting van de rotatie wordt bepaald door de te maximaliseren of minimaliseren afstand:
  • Varimax: maximaliseert per factor de variantie van de ladingen op deze factor
  • Quartimax (~oblimax): maximaliseert per variabele de variantie van de ladingen op de verschillende factoren
  • Geomin (Mplus), oblimin, equamax, ...
Er zijn slechts vuistregels omtrent de interpretatie van de factorladingen. Vanaf .400 en zeker vanaf .600 spreken we van hoge ladingen, al hangt het telkens af van de rotatiemethode.
Links
Yahoo Answers: What are difference between varimax, quartimax and equamax rotation in factor analysis? - http://answers.yahoo.com/question/index?qid=20080616044600AAnsCc4

maandag 22 augustus 2011