Quiero evaluar la eficiencia de dos algoritmos de aprendizaje automatico pero primero quiero saber que conjuntos de datos actual uso para poder entrenar y probar eso algoritmos. agresco sus respuestas compañeros.
Mi español no es muy bueno pero, si entiendo correctamente, quieres datos de tentativas de intrusión. Puedo darte una gran cantidad de intentos de intrusión a través del puerto 80
1) Define cuales son tus usuarios y tus sistemas y entonces define que es aceptable dentro de cada uno de ellos. Por ejemplo, si tu perfil de usuarios es administrativo y se conecta por ssh entonces no puedes clasificar esto como un problema de seguridad.
2) Define cual es tu atacante y cuales son sus metas. define si el atacante es interno o externo.
3) No es lo mismo monitorear una tarjeta externa para intrusos externos que monitorearlo desde la tarjeta interna
4) define cual es tu activo que se esta protegiendo y cual es su vulnerabilidad.
Sin estos datos cualquier esfuerzo de utilizar cualquier método de seguridad es inútil en la practica y en ambiente académico (aunque algunos académicos quieran decir lo opuesto).
Gracias por las ideas, pero lo que busco en si, es saber que conjunto de datos utilizo para evaluar dos algoritmos (naive bayes y arbol de decision c4.5) he visto varias dataset como, NSL-KDD, UNB ISCX 2012, UNSW-NB15 y UGR’16 pero todas tienen ventajas y desventajas no se cual elegir. quiero más ideas solo tengo una semana para dicidir. y sigo confundido