Download twitter stream
Document related concepts
no text concepts found
Transcript
Twitter stream and geo localization Ofelia Cervantes 1 Twitter stream Tweepy 1. Modulo que permite a Python hacer una conexión con la API de Twitter. 2. Permite extraer y enviar información de Twitter: • Enviar tweets. • Extraer información de usuario. • Extraer información en tiempo real de Twitter acerca de distintos tópicos de búsqueda. • Etc. 3. Puede ver mas información acerca de este modulo en:http://www.tweepy.org/ Ofelia Cervantes Twitter stream Instalar Tweepy 1. Abrir una ventana de línea de comandos dependiendo de su sistema operativo (cmd o bash). 2. Escribir y ejecutar la siguiente instrucción: pip install tweepy Nota: debe tener instalada la versión 2.7 de Python y Pip. Ofelia Cervantes Twitter stream Verificar la instalación 1. Abrir una ventana de línea de comandos dependiendo de su sistema operativo (cmd o bash). 2. Escribir y ejecutar la siguiente instrucción: Python 3. Dentro de la línea e comando de Python (>>) escribir lo siguiente: Import tweepy 4. En caso de ningún error cerrar la ventana de línea de comandos, en caso contrario tratar de volver a instalar usando pip. Ofelia Cervantes Twitter stream Ejecutar programa 1. Cambiar las siguientes variables en el programa twitterStream.py • tweetNumber: agregar el numero de tweets que desea bajar. • oauth tokens: agregar las llaves de acceso de a la API de Twitter: – – – – consumer_key consumer_secret access_token_key access_token_secret • setTerms: agregar el conjunto de términos asociados a la búsqueda, tomando en cuenta que puede ser un numero ilimitado de términos. 2. Ejecutar la aplicación de python Ofelia Cervantes Twitter stream Resultados de la ejecución 1. Un archivo llamado <fecha de creación> con los N tweets en formato JSON 2. Un JSON por cada línea del archivo (un archivo JSON de JSONs). 3. Puede ver un ejemplo de un tweet en formato JSON en el archivo llamado metadataTwitterExample.txt. 4. Puede ver los atributos de cada uno de los tweets en el archivo llamado metadataTwitter.txt Ofelia Cervantes Twitter geo localization Geopy 1. Modulo que permite a Python obtener coordenadas de ciudades, países y distintas locaciones alrededor del mundo. 2. Geopy incluye información de servicios de búsqueda como ArcGIS, Google Geocoding API, Yahoo! PlaceFinder, etc. 3. Puede ver mas información acerca de este modulo en: https://pypi.python.org/pypi/geopy Ofelia Cervantes Twitter geo localization Instalar Geopy 1. Abrir una ventana de línea de comandos dependiendo de su sistema operativo (cmd o bash). 2. Escribir y ejecutar la siguiente instrucción: pip install geopy Nota: debe tener instalada la versión 2.7 de Python y Pip. Ofelia Cervantes Twitter geocode Verificar la instalación 1. Abrir una ventana de línea de comandos dependiendo de su sistema operativo (cmd o bash). 2. Escribir y ejecutar la siguiente instrucción: Python 3. Dentro de la línea e comando de Python (>>) escribir lo siguiente: from geopy.geocoders import Nominatim 4. En caso de ningún error cerrar la ventana de línea de comandos, en caso contrario tratar de volver a instalar usando pip. Ofelia Cervantes Twitter geo localization Ejecutar programa 1. Cambiar la siguientes variables en el programa geoPosition.py • inputFileName: agregar el nombre del archivo que desea abrir (el archivo obtenido del programa de twitterStream.py). • outputFileName: agregar el nombre del archivo de salida, el cual contendrá la geolocalización de la mayoría de JSONs. 2. Ejecutar la aplicación de Python. Ofelia Cervantes Twitter geo localization Resultados de la ejecución 1. Un archivo con el nombre de la variable outputFileName con los tweets de los cuales se pudo obtener su localización (en formato JSON). 2. Si existe la localización esta se almacenara en la propiedad coordinates del JSON. 3. Puede ver un ejemplo de un tweet en formato JSON en el archivo llamado metadataTwitterExample.txt. 4. Puede ver los atributos de cada uno de los tweets en el archivo llamado metadataTwitter.txt Ofelia Cervantes