Resumen:
|
[ES] El objetivo del TFG es analizar la aplicación de técnicas de aprendizaje reforzado (reinforcement learning) para la gestión de la congestión del tráfico mMTC en redes 5G, que utiliza un protocolo de acceso del tipo ...[+]
[ES] El objetivo del TFG es analizar la aplicación de técnicas de aprendizaje reforzado (reinforcement learning) para la gestión de la congestión del tráfico mMTC en redes 5G, que utiliza un protocolo de acceso del tipo grant-free . Se estudiará un escenario con tráfico heterogéneo proveniente de dos tipos de user equipments (UE), que denominaremos high priority traffic (HPT) y low priority traffic (LPT). En cada subtrama de acceso upstream , se deberá realizar una asignación dinámica de los V slots de la subtrama, asignando m1 slots para el HPT y m2 para el LPT, m1+m2=V. En cada subtrama, m1 se elegirá de forma que se minimice la probabilidad de colisión para el tráfico HPT. Los slots restantes m2=V-m1, se asignarán al LPT.
El perfil de tráfico HPT será de tipo Binomial, o de Poisson. La distribución del número de llegadas del LPT por subtrama seguirá una distribución Beta(3,4), siguiendo las directrices del 3GPP.
Los parámetros de mérito que se utilizarán para la evaluación serán: el caudal cursado para el HPT y LPT, el retardo de acceso para el HPT y LPT, la probabilidad de pérdida de paquetes para el HPT y LPT, la probabilidad de acceso para LPT, el número medio de intentos de acceso para el LPT. El estudio se realizará mediante simulación por eventos discretos.
[-]
[EN] The objective of the TFG is to analyze the application of reinforcement learning techniques to the congestion management of mMTC traffic in 5G networks, which uses a 'grant-free' access protocol. A scenario with ...[+]
[EN] The objective of the TFG is to analyze the application of reinforcement learning techniques to the congestion management of mMTC traffic in 5G networks, which uses a 'grant-free' access protocol. A scenario with heterogeneous traffic from two types of 'user equipments' (UE) will be studied, which we will refer to as 'high priority traffic' (HPT) and 'low priority traffic' (LPT). In each 'upstream' access subframe, the V slots of a subframe will be dynamically assign, m1 slots for the HPT and m2 for the LPT, m1+m2=V. In each subframe, m1 shall be chosen such that the collision probability for HPT traffic is minimized. The remaining slots m2=V-m1, will be assigned to the LPT. The HPT traffic profile will be Binomial, or Poisson. The distribution of the number of LPT arrivals per subframe will follow a Beta(3,4) distribution, following the 3GPP guidelines.
The key performance parameters that will be used for the evaluation will be: the throughput for HPT and LPT, the access delay for HPT and LPT, the packet loss probability for HPT and LPT, the access probability for LPT, the average number of access attempts for the LPT. The study will be carried out using discrete event simulation.
[-]
|