Last updated: 15 September 2003
2003 German Stata Users Group meeting
Tuesday, 12 August 2003
Humboldt-Universität zu Berlin
Room number HS 2014 a
Unter den Linden 6
10099 Berlin Germany
Proceedings
Vince Wiggins,
StataCorp
-
Additional information
wiggins.pdf
example.pdf
nls.dta
Ulrich Kohler,
WZB
-
Abstract
Replizierbarkeit ist eines der wichtigsten Kriterien professioneller
Datenanalyse. Um diese Replizierbarkeit zu erreichen, können do-files
geschrieben werden. Dabei sollte die Arbeit so organisiert sein, dass
veröffentlichte Ergebnisse auch langfristig d en zu Grunde liegenden do-files
zugeordnet werden k�nnen. Doch dies reicht dennoch oft nicht aus. In der
Praxis stellen sich einer wirklichen Replizierbarkeit eine ganze Reihe von
Problemen in den Weg. Der Vortrag diskutiert diese Probleme und stellt L�s
ungsvorschl�ge vor.
Additional information
kohler.pdf
Hildegard Schaeper,
Hochschul-Informations-System GmbH
-
Abstract
Im Rahmen des Vortrages sollen zwei neue Stata-Ados präsentiert werden, welche
die Analyse von Mehrfachantwortgruppen erleichtern.
Additional information
schaeper.ppt
Johannes Giesecke,
Humboldt University
-
Abstract
Statistische Modelle, die den Prozess der Einkommensdetermination beschreiben,
gehören mittlerweile zum Standardrepertoire quantitativ ausgerichteter
sozialwissenschaftlicher Untersuchungen. Im Regelfall werden dabei Daten aus
Einmalbefragungen (Quersch nittsuntersuchungen) verwendet, das typischerweise
benutzte Schätzverfahren ist eine OLS-Regression. Allerdings unterliegt die
OLS-Schätzung äu�erst restriktiven Annahmen, die häufig der
Realität nicht
standhalten. Ergebnis solcher Annahmeverletzungen si nd verzerrte Schätzer
für die Regressionskoeffizienten und/oder f�r deren Standardabweichungen. Durch
die Wahl geeigneter Verfahren (wie z.B. robuste Varianzschätzungen oder
IV-Schätzungen) kann versucht werden, die Verzerrungen zu korrigieren, was
jedoc h nur im begrenzten Rahmen möglich ist.
Liegen statt Querschnittsdaten Informationen aus Mehrfachbefragungen
(Paneldaten) vor, ist es mit Hilfe geeigneter Regressionsmodelle f�r
Paneldaten möglich, den Einfluss nicht gemessener/ nicht messbarer
individuenspezifischer Effekte zu kontrollieren u nd somit eine wichtige
Quelle für Verzerrungen auszuschlie�en. Paneldaten bieten daher eine
ausgezeichnete M�glichkeit, die aus Querschnittsdaten gewonnenen Ergebnisse
kritisch hinsichtlich ihrer Genauigkeit zu überprüfen.
In dem Vortrag soll anhand einer Fragestellung aus der soziologischen
Arbeitsmarktforschung ? Welche Einkommenseffekt können von so genannten
�flexiblen� Besch�ftigungsformen (wie Teilzeit und befristeter Besch�ftigung)
erwartet werden? - aufgezeigt werd en, ob und inwieweit sich die Ergebnisse
einer herk�mmlichen OLS-Regression von denen einer Regression f�r Paneldaten
unterscheiden. Gleichzeitig werden anwendungsbezogene Probleme beim Umsetzen
von Panelmodellen mit STATA diskutiert und m�gliche L�sunge n aufgezeigt.
Hierbei stehen Fragen der Modellauswahl (fixed- vs. random-effects) sowie
m�gliche Selektionseffekte im Vordergrund.
Additional information
giesecke.ppt
Daniel Müller,
Institute of Rural Development, University of Goettingen
-
Abstract
Economists have increasingly adopted spatial analytical and spatial
econometric perspectives to study questions like the geographical targeting of
policy interventions, central place hierarchies and regional agglomeration,
the diffusion of technologies a cross space, or causes and consequences of
land cover change. To take locations explicitly into account in econometric
estimations can be of great benefit for researchers working at the interface
of economics, environmental sciences, and geography.
The objective of this talk is to demonstrate the potential merit of spatially
explicit analysis by estimating a spatial econometric model within Stata,
which employs georeferences raster data derived from satellite imagery and a
geographical information system (GIS).
The proposed talk exemplifies a distinct application that investigates the
role of geophysical, agro ecological, and socio-economic determinants of
land-use change in the Central Highlands of Vietnam. It involves the
combination of remotely sensed satell ite data, high-resolution GIS data and a
village survey to assess the influences of various rural development policies
on land-cover changes. I will demonstrate the structure of GIS raster data and
present several Stata commands implemented as ado-files, which serve to import
raster data into Stata, draw regular samples over space, and export estimation
results back into the GIS. The econometric model data will be analyzed in a
spatially explicit way using a multinomial logit model. Predictions result i n
probability estimates for each location, which are used to create probability
maps allowing for a geovisual assessment as an additional goodness-of-fit
measure of the model within the GIS.
Additional information
mueller.ppt
John Haisken–de New,
RWI Essen, DIW Berlin, IZA Bonn
-
Abstract
soepmenu is a Stata-based tool intended to ease working with large panel
datasets when running retrievals. As the German Socio-Economic Panel (SOEP)
has 18 waves and more than 210 files, correct matching of information over
time and level (e.g., household vs. person) can be tedious. Further, the
variable naming scheme of the SOEP follows the question order in the
particular year's questionnaire, such that without an "item-correspondence",
there is no systematic way of knowing the variable name from year "t", given
one knows the name at time "t-1". Therefore, for simplification, all datasets
contents are viewed as collection of "items" in an "item correspondence" and
not as "variables". One opens the data files from a drop-down menu system, and
the "items" are displayed for selection. Alternatively, one can browse ALL
items in a browse page, allowing one to select items to be saved into a
"basket". By "collecting" many items into the basket, one creates a list of
items to be pulled out of the dataset in the retrieval. Additionally, all SOEP
questionnaires have been translated into SMCL pages, with clickable variable
names in the questionnaire. At the click of a button, the retrieval is run,
according to the options the user has chosen. Not only is a "wide" file
produced, but also a "long" file (in "reshape" terminology). The long file is
possible as all wide file variables have been renamed according the "serial
number" of the particular item. There is also a checking procedure to examine
whether value labels have changed over time. For items that change their
contents or definition over time, there is a standardized interface to allow
"plugins" to recode old variables, generate new variables, etc. Once one has
created the wide and long data files, one can browse them interactively with
the browse tools provided. As the tool automatically pulls out the appropriate
weighting factors, these can be used at the click of a button. The "SOEP
project" or the collection of "items" in the "basket", can be saved, reloaded,
appended, etc. This allows the addition of modulized baskets. All data can be
dumped out directly for use in SPSS, SAS (keeping all labels), and Excel. As
the SOEP data are bilingual (German and English), one can switch between
languages with any input and output file (one can use English labeled input
files and automatically produce German labeled retrieval files).
soepmenu is written for Stata 8.
Bill Gould,
StataCorp