Home  /  Resources & support  /  Users Group meetings  /  2003 German Stata Users Group meeting

Last updated: 15 September 2003

2003 German Stata Users Group meeting

Tuesday, 12 August 2003

Organizers: AnkeLemke, Helga Meinhardt, and Anke Mrosek

Humboldt-Universität zu Berlin
Room number HS 2014 a
Unter den Linden 6
10099 Berlin Germany

Proceedings


The organization of statistical analysis in Stata, an overview


Vince Wiggins, StataCorp
Additional information

wiggins.pdf

example.pdf

nls.dta

Replizierbare Analysen mit Stata


Ulrich Kohler, WZB
Abstract

Replizierbarkeit ist eines der wichtigsten Kriterien professioneller Datenanalyse. Um diese Replizierbarkeit zu erreichen, können do-files geschrieben werden. Dabei sollte die Arbeit so organisiert sein, dass veröffentlichte Ergebnisse auch langfristig d en zu Grunde liegenden do-files zugeordnet werden k�nnen. Doch dies reicht dennoch oft nicht aus. In der Praxis stellen sich einer wirklichen Replizierbarkeit eine ganze Reihe von Problemen in den Weg. Der Vortrag diskutiert diese Probleme und stellt L�s ungsvorschl�ge vor.

Additional information

kohler.pdf

Analyse von Mehrfachantwortgruppen


Hildegard Schaeper, Hochschul-Informations-System GmbH
Abstract

Im Rahmen des Vortrages sollen zwei neue Stata-Ados präsentiert werden, welche die Analyse von Mehrfachantwortgruppen erleichtern.

Additional information

schaeper.ppt

Einkommensanalysen mit Paneldaten


Johannes Giesecke, Humboldt University
Abstract

Statistische Modelle, die den Prozess der Einkommensdetermination beschreiben, gehören mittlerweile zum Standardrepertoire quantitativ ausgerichteter sozialwissenschaftlicher Untersuchungen. Im Regelfall werden dabei Daten aus Einmalbefragungen (Quersch nittsuntersuchungen) verwendet, das typischerweise benutzte Schätzverfahren ist eine OLS-Regression. Allerdings unterliegt die OLS-Schätzung äu�erst restriktiven Annahmen, die häufig der Realität nicht standhalten. Ergebnis solcher Annahmeverletzungen si nd verzerrte Schätzer für die Regressionskoeffizienten und/oder f�r deren Standardabweichungen. Durch die Wahl geeigneter Verfahren (wie z.B. robuste Varianzschätzungen oder IV-Schätzungen) kann versucht werden, die Verzerrungen zu korrigieren, was jedoc h nur im begrenzten Rahmen möglich ist.

Liegen statt Querschnittsdaten Informationen aus Mehrfachbefragungen (Paneldaten) vor, ist es mit Hilfe geeigneter Regressionsmodelle f�r Paneldaten möglich, den Einfluss nicht gemessener/ nicht messbarer individuenspezifischer Effekte zu kontrollieren u nd somit eine wichtige Quelle für Verzerrungen auszuschlie�en. Paneldaten bieten daher eine ausgezeichnete M�glichkeit, die aus Querschnittsdaten gewonnenen Ergebnisse kritisch hinsichtlich ihrer Genauigkeit zu überprüfen.

In dem Vortrag soll anhand einer Fragestellung aus der soziologischen Arbeitsmarktforschung ? Welche Einkommenseffekt können von so genannten �flexiblen� Besch�ftigungsformen (wie Teilzeit und befristeter Besch�ftigung) erwartet werden? - aufgezeigt werd en, ob und inwieweit sich die Ergebnisse einer herk�mmlichen OLS-Regression von denen einer Regression f�r Paneldaten unterscheiden. Gleichzeitig werden anwendungsbezogene Probleme beim Umsetzen von Panelmodellen mit STATA diskutiert und m�gliche L�sunge n aufgezeigt. Hierbei stehen Fragen der Modellauswahl (fixed- vs. random-effects) sowie m�gliche Selektionseffekte im Vordergrund.

Additional information

giesecke.ppt

Stata in Space: An example for the econometric analysis of spatially explicit raster data


Daniel Müller, Institute of Rural Development, University of Goettingen
Abstract

Economists have increasingly adopted spatial analytical and spatial econometric perspectives to study questions like the geographical targeting of policy interventions, central place hierarchies and regional agglomeration, the diffusion of technologies a cross space, or causes and consequences of land cover change. To take locations explicitly into account in econometric estimations can be of great benefit for researchers working at the interface of economics, environmental sciences, and geography.

The objective of this talk is to demonstrate the potential merit of spatially explicit analysis by estimating a spatial econometric model within Stata, which employs georeferences raster data derived from satellite imagery and a geographical information system (GIS).

The proposed talk exemplifies a distinct application that investigates the role of geophysical, agro ecological, and socio-economic determinants of land-use change in the Central Highlands of Vietnam. It involves the combination of remotely sensed satell ite data, high-resolution GIS data and a village survey to assess the influences of various rural development policies on land-cover changes. I will demonstrate the structure of GIS raster data and present several Stata commands implemented as ado-files, which serve to import raster data into Stata, draw regular samples over space, and export estimation results back into the GIS. The econometric model data will be analyzed in a spatially explicit way using a multinomial logit model. Predictions result i n probability estimates for each location, which are used to create probability maps allowing for a geovisual assessment as an additional goodness-of-fit measure of the model within the GIS.

Additional information

mueller.ppt

-soepmenu- is a Stata-based tool intended to ease working with large panel datasets when running retrievals


John Haisken–de New, RWI Essen, DIW Berlin, IZA Bonn
Abstract

soepmenu is a Stata-based tool intended to ease working with large panel datasets when running retrievals. As the German Socio-Economic Panel (SOEP) has 18 waves and more than 210 files, correct matching of information over time and level (e.g., household vs. person) can be tedious. Further, the variable naming scheme of the SOEP follows the question order in the particular year's questionnaire, such that without an "item-correspondence", there is no systematic way of knowing the variable name from year "t", given one knows the name at time "t-1". Therefore, for simplification, all datasets contents are viewed as collection of "items" in an "item correspondence" and not as "variables". One opens the data files from a drop-down menu system, and the "items" are displayed for selection. Alternatively, one can browse ALL items in a browse page, allowing one to select items to be saved into a "basket". By "collecting" many items into the basket, one creates a list of items to be pulled out of the dataset in the retrieval. Additionally, all SOEP questionnaires have been translated into SMCL pages, with clickable variable names in the questionnaire. At the click of a button, the retrieval is run, according to the options the user has chosen. Not only is a "wide" file produced, but also a "long" file (in "reshape" terminology). The long file is possible as all wide file variables have been renamed according the "serial number" of the particular item. There is also a checking procedure to examine whether value labels have changed over time. For items that change their contents or definition over time, there is a standardized interface to allow "plugins" to recode old variables, generate new variables, etc. Once one has created the wide and long data files, one can browse them interactively with the browse tools provided. As the tool automatically pulls out the appropriate weighting factors, these can be used at the click of a button. The "SOEP project" or the collection of "items" in the "basket", can be saved, reloaded, appended, etc. This allows the addition of modulized baskets. All data can be dumped out directly for use in SPSS, SAS (keeping all labels), and Excel. As the SOEP data are bilingual (German and English), one can switch between languages with any input and output file (one can use English labeled input files and automatically produce German labeled retrieval files). soepmenu is written for Stata 8.

Report to users & Wishes and grumbles


Bill Gould, StataCorp