Área do cabeçalho
gov.br
Portal da UFC Acesso a informação da UFC Ouvidoria Conteúdo disponível em:Português
Brasão da Universidade Federal do Ceará

Universidade Federal do Ceará
Laboratório de Tecnologias Inovadoras

Área do conteúdo

Linhas de Pesquisa da Professora Rosineide

Quando se tem um processo que gera muitos dados muitas vezes existe interesse em encontrar relações entre as variáveis que geram estes dados, identificando padrões que permitam, por exemplo, analisar impactos causados por uma ou mais variáveis sobre outras, obter predições, realizar classificações entre outros. Assim, é comum que se tenha um objetivo e um conjunto de informações que podem ou não ser relevantes para atingir este objetivo. Neste caso, modelos estatísticos podem ser utilizados para estabelecer estas relações por meio de formulações matemáticas.

Num contexto de modelos de regressão, as informações disponíveis são utilizadas como variáveis explicativas, independentes, que são aquelas que podem fornecer a solução para o problema em questão, enquanto as informações de interesse (reposta ao problema) são chamadas de variáveis dependentes ou variáveis resposta. Assim, a relação existente entre a variável (ou variáveis) resposta (Y ) e a variável (ou variáveis) independente (X) é descrita por uma função matemática f(X) fixa, de forma única. Esta função estabelece quanto da mudança nas variáveis independentes influenciam na variável resposta. A coleta de uma amostra destas variáveis ajuda a estabelecer a forma aproximada de f. Assim a variável resposta é dada por Y = h(X) +erro. O termos de erro indica que, mesmo que seja possível encontrar a função h(X), a relação entre Y e X, dada pela h(.), não é perfeita, dando origem a um termo de erro (podendo ser multiplicativo, aditivo etc), que é uma variável aleatória, geralmente considerada ter média zero e variância constante. Com essas suposições, a estimativa de Y , a partir de uma amostra aleatória observada de Y e um conjunto de observações de X, é dada pela função estimada, de modo que o valor esperado Yˆ = E[Y ] = E[h(X) + erro] = h(X), é uma estimativa de Y , que muitas vezes é usado para prever Y, dado um conjunto de observações de X. A função h(X) retorna um número qualquer na reta, sendo muitas vezes uma função linear nos seus coeficientes (não necessariamente em X) dando origem aos modelos de regressão lineares [15]. Caso a função h(.) não seja linear em seus coeficientes, tem-se o modelo de regressão não linear [2]. Como h(.) retorna um número na reta, se Y assume valores em um intervalo limitado inferiormente, superiormente ou ambos, pode-se pensar em um modelo de regressão linear generalizado [14], em que a relação t(E[Y ]) = h(X) se dá por meio de uma transformação t(.) que leva o intervalo limitado à reta. Esta função é chamada de função de ligação, devendo ser duas vezes diferenciável e monotônica. Neste contexto, uma distribuição probabilística é assumida para a variável resposta Y, que no caso de ser a normal, a função de ligação é a identidade levando ao modelo de regressão linear com uma suposição a mais, a saber, a normalidade dos erros. Dependendo do tipo de problema a ser tratado, outros tipos de modelos de regressão podem ser requeridos, como por exemplo, um modelo de regressão com efeito aleatório para medidas repetidas ao longo do tempo, podendo ser linear, não linear ou generalizado [5, 9, 10].
Quanto mais complexo é o problema, maior pode ser a complexidade envolvida no processo de modelagem, requerendo, assim, o estudo, ou desenvolvimento, de técnicas que levem à solução de problemas de diversas áreas do conhecimento.

 

Logotipo da Superintendência de Tecnologia da Informação
Acessar Ir para o topo